通義實驗室於2026年6月18日宣佈開源首個基於統一“科學語法”的多領域科學生成基礎模型 LOGOS(Language Of Generative Objects in Science)。
該模型由 ATH-Token Foundry 聯合中國人民大學高瓴人工智能學院共同研發,旨在打破傳統 AI for Science(AI4S)領域“一任務一專家模型”的割裂現狀,通過將蛋白質、小分子、材料和化學反應等異構科學對象編碼爲統一的離散 Token 序列,實現了跨領域知識的整合與原生大模型框架下的自迴歸生成。

LOGOS 核心突破在於其創新的“科學語法”設計與空間交互離散化技術,使模型無需依賴稀缺的3D 座標數據和專用幾何網絡,僅憑序列預測即可深度理解複雜的3D 空間互作規律,並實現預訓練與下游任務在形式與目標上的完全一致。
評測數據顯示,僅擁有1B 參數量的 LOGOS-1B 在口袋條件配體生成、逆合成預測(Top-1準確率達74.8%)、口袋位點識別(HOLO4K 數據集 Top-n 準確率達58.5%)以及 MOF 材料生成(新型構建單元比例提升76%)等六大代表性任務中,均一致性地匹配或超越了領域專用方法,甚至以1/56的參數量在多個任務上超越了8×7B 的 NatureLM。

通過繼承大語言模型(LLM)的預訓練權重,LOGOS 不僅能直接複用 vLLM 推理加速、模型量化等成熟的工程基建,更打破了學科壁壘,推動自然科學研究從“篩選已知”向“設計驅動”轉變。目前,該模型的權重、推理代碼及技術報告已在全球開源。
