神經網絡架構KAN迎來了它的2.0版本,這次更新讓KAN與科學問題的結合更加深入,特別是在經典物理學研究領域。研究者現在可以定製自己的KAN2.0,將專業知識融入模型,以發現物理系統中的拉格朗日量等重要概念。
KAN2.0允許研究者根據個人需求定製模型,將專業知識作爲輔助變量,爲經典物理學的研究提供新的視角。
新框架KAN2.0致力於解決AI與科學之間固有的不兼容性問題。它通過雙向協同作用——將科學知識融入KAN,並從KAN中提取科學見解——來實現AI與科學的統一。
KAN2.0的三大新功能
MultKAN:引入乘法節點的KAN,增強了模型的表達能力。
kanpiler:一個將符號公式編譯成KAN的編譯器,提高了模型的實用性。
樹轉化器:將KAN2.0架構轉換爲樹狀圖,增強了模型的解釋性。
KAN2.0在科學發現中的作用主要體現在三個方面:識別重要特徵、揭示模塊結構、發現符號公式。這些功能在原始KAN基礎上得到了增強。
KAN2.0的解釋性更加通用,適用於化學、生物學等難以用符號方程表示的領域。用戶可以將模塊化結構構建到KAN2.0中,並通過與MLP神經元交換,直觀地看到模塊化結構。
研究團隊計劃將KAN2.0應用於更大規模的問題,並將其擴展到物理學以外的其他科學學科。
此次研究由來自MIT、加州理工學院、MIT CSAIL等機構的五位研究者共同完成,其中包括三位華人學者。論文一作劉子鳴是MIT的四年級博士生,他的研究興趣集中在人工智能與物理學的交叉領域。
論文地址:https://arxiv.org/pdf/2408.10205
項目地址:https://github.com/KindXiaoming/pykan