上海AIラボは2月4日に、世界最大のパラメータ数を誇るオープンソースの科学マルチモーダルモデル「ShuSheng Intern-S1-Pro」を正式に発表しました。この画期的なモデルは、「通専融合(Tongzhuang Ronghe)」技術アーキテクチャSAGEに基づいており、保有するパラメータ数は1兆個と、現在のオープンソースコミュニティの中で最も注目を集める存在となっています。

「ShuSheng Intern-S1-Pro」モデルの核心的な科学的能力は国際的に先進的であり、特に高難度の総合学科評価において非常に優れた論理的推論能力を示しており、オリンピック競技で金メダルを獲得した選手レベルに達しています。また、本モデルは実際の科学研究プロセスにおけるインテリジェントエージェントの能力において、オープンソースモデルの中でも最上位クラスに位置付けられており、研究者にとってより強力なツールを提供しています。

このモデルは混合エキスパートアーキテクチャ(MoE)を採用しており、全体で512のエキスパートが構成されており、一度の呼び出しでは8つのエキスパートのみがアクティブ化され、22億のパラメータを使用します。このような設計により、モデルの計算効率が最適化され、リソースの消費量も大幅に削減されています。ベースラインアーキテクチャにおいて、「ShuSheng Intern-S1-Pro」は2つの重要な突破を遂げています。まず、フーリエ位置符号化と時系列符号化器の再構築を通じて、モデルは微視的な生命信号から巨視的な宇宙の波動に至る「物理的直感」を獲得し、より強い理解力を備えています。次に、効率的なルーティングメカニズムを採用することで、1兆のパラメータを持つモデルのトレーニングにおける安定性と計算効率の課題を解決し、超大規模モデルのトレーニングの基礎を築いています。

注目すべき点として、「ShuSheng Intern-S1-Pro」は単なる学術モデルだけでなく、今後のAGI4S(人工知能による科学)のオープン共有インフラストラクチャの構築にも堅固な基盤を提供しています。独自のモデルアーキテクチャと自前の計算技術を通じて、上海AIラボは中国が人工知能分野で持つ実力と可能性を示しています。

さらに多くのユーザーがこの先進的なモデルを体験できるようにするため、上海AIラボはオンラインでの体験やオープンソースのリンクを提供しており、開発者や研究者がさらに探求できるようにしています。