最近、中国科学院自動化研究所と沐曦 MetaXが協力して、世界初の類脳スパイク大規模モデル「瞬悉 1.0(SpikingBrain-1.0)」を成功裏に発表し、中国が大規模モデル技術分野で重要な一歩を踏み出したことを示しました。この革新は、全プロセスの国内製品化を実現しただけでなく、超長シーケンス推論において顕著な効率向上を示しています。

「瞬悉 1.0」は、脳の神経細胞の複雑な働きについての深い研究に基づいており、「内生的複雑性を基盤とする」大規模モデルアーキテクチャを提案しました。このモデルは、スパイクニューラルネットワークの内生ダイナミクスと線形アテンションモデルとの関係を確立することで、大規模モデルの発展に新たな道を開きました。李国齊教授は、この成果の公開は、中国が類脳計算と大規模モデルの統合におけるイノベーション能力を示すだけでなく、今後の神経形状計算やチップ設計に新たなアイデアを提供するものであると述べました。

開発チームは「瞬悉 1.0-7B」モデルをオープンソースとして公開し、「瞬悉 1.0-76B」のテストサイトも開放しました。これらのモデルは業界で広く検証されており、法律や医療などの分野での効率的な応用可能性を持っています。また、チームは国内の沐曦 MetaX シークレット C550 GPUクラスタ向けに効率的なトレーニングおよび推論フレームワークを開発し、大規模モデルの利用をよりスムーズかつ効率的にしました。

「瞬悉 1.0」の登場により、国内の大規模モデル技術の突破は、超長シーケンスアプリケーションにおけるモデリング効率を大幅に向上させ、関連技術のさらなる発展を促進します。今後、この技術が法務、医療、科学シミュレーションなど多くの分野で広範囲に応用され、さらなるイノベーションの可能性をもたらすことが期待されます。