通義ラボは2026年6月18日に、統一された「科学文法」を基盤とする最初の多分野科学生成基礎モデルであるLOGOS(Language Of Generative Objects in Science)を開源することを発表しました。

このモデルはATH-Token Foundryと中国人民大学高瓴人工智能学院が共同で開発したもので、従来のAI for Science(AI4S)領域における「1つのタスクごとに専門モデル」という分割状態を打破し、タンパク質、小分子、材料、化学反応などの非構造的な科学的オブジェクトを統一された離散トークンシーケンスに符号化することで、異なる分野の知識を統合し、大規模モデルフレームワーク内で元生の自己回帰生成を実現しています。

QQ20260618-105452.jpg

LOGOSの核心的な突破点は、革新的な「科学文法」の設計と空間相互作用の離散化技術です。これにより、モデルは貴重な3D座標データや専用の幾何ネットワークに依存することなく、シーケンス予測によって複雑な3D空間相互作用の法則を深く理解し、プレトレーニングと下流タスクの形式と目的において完全に一致させることができます。

評価データによると、パラメータ数が1BのLOGOS-1Bは、ポケット条件リガンド生成、逆合成予測(Top-1の正確率は74.8%)、ポケット部位認識(HOLO4KデータセットのTop-nの正確率は58.5%)、およびMOF材料生成(新しい構成ユニットの割合が76%増加)など、6つの代表的なタスクにおいて一貫して専門的な手法と同等またはそれを上回り、さらにパラメータ数が1/56のサイズで、8×7BのNatureLMを多くのタスクで超えています。

QQ20260618-105459.jpg