2025年世界人工知能大会(WAIC2025)の直前、ステップスターランは上海でその新世代の基礎大規模モデル「Step3」を発表しました。このモデルは知能性に大きな進歩を遂げており、推論効率も考慮しており、企業や開発者に対して最適な応用ソリューションを提供することを目指しています。Step3は7月31日に正式にオープンソース化される予定であり、ステップスターランがグローバルなオープンソースコミュニティに強力なマルチモーダル推論モデルを貢献することを示しています。
大規模モデルの実用化を促進するために、ステップスターランは国内でリーディングなチップおよびプラットフォームメーカーと連携し、「モーシンエコシステムイノベーション連盟」を設立しました。この連盟の目的は、モデルとチップ産業チェーンとの革新的な協力を通じて、大規模モデルがさまざまな業界での応用を加速することです。また、ステップスターランは上海国有資本投資有限公司と戦略的協力関係を結び、資本とエコシステムビジネスの協力を強化することを目的としています。
ステップスターランの創設者兼CEOである姜大昕氏は、Step1からStep2への迅速な反復により、チームが最も適切な応用モデルを考える際、顧客の実際のニーズをより重視するようになったと述べました。新世代のStep3モデルは「推論時代の最適な応用モデル」として定義されており、強力な知能、低コスト、オープンソース可能、マルチモーダルなどの特徴を持っています。これらの4つの側面は欠かせません。
Step3はステップスターラン初のフルサイズのネイティブマルチモーダル推論モデルであり、パラメータ数は321Bで、活性化パラメータ数は38Bです。視覚認識や複雑な推論において優れた性能を発揮し、跨領域の知識理解や視覚情報分析を処理できます。例えば、反射したメニューの内容を正確に読み取ることができ、さらに微信のチャット履歴の中で自動的に消費分担の費用を計算することも可能です。Step3は多くのランキングでオープンソースマルチモーダル推論モデルのSOTA(最良成績)を達成しています。
推論効率の向上のために、ステップスターランはアーキテクチャ設計において革新を行い、Step3が異なるハードウェアプラットフォーム上で優れた推論性能を発揮できるようにしました。テストによると、Step3は中国製チップでの推論効率がDeepSeek-R1の300%に達し、NVIDIA Hopperアーキテクチャチップでの分散推論においてはスループットが70%以上向上しています。
ステップスターランは「1+N」のモデルマトリクスを構築しており、「1」はStep3を指し、「N」は音声、視覚認識、画像生成などの分野をカバーする複数のマルチモーダルモデルを指します。近い10社のチップおよびインフラストラクチャメーカーと連携することで、ステップスターランは大規模モデルの適合性と演算効率を向上させ、アプリケーションの実用化を推進することを目指しています。
注目ポイント:
🌟 新世代の基礎大規模モデルStep3は7月31日にオープンソース化され、マルチモーダル推論モデルにおける重要な進歩を示しています。
🤝 ステップスターランは複数のチップおよびプラットフォームメーカーと共同で「モーシンエコシステムイノベーション連盟」を設立し、大規模モデルの実用化を加速しています。
📈 Step3は推論効率において優れた性能を発揮し、多様なハードウェアプラットフォーム上で効率的に動作できます。