2025年11月13日に開催された百度(バイドゥ)ワールドカンファレンスで、百度は最新のネイティブ・フルモーダル大規模モデルである「文心5.0(ウェンシン5.0)」を正式に発表しました。このモデルは2.4兆ものパラメータを持ち、ネイティブ・フルモーダル統一モデリング技術を採用しており、テキスト、画像、音声、動画などのさまざまな情報を同時に理解し生成することができ、非常に強力なマルチモーダル能力を備えています。

文心5.0は、マルチモーダル理解、指示の遵守、創造的ライティング、事実性、エージェントの計画、ツールの応用などにおいて優れた性能を発揮しています。その理解力、論理的推論力、記憶力、説得力も大幅に向上しています。40以上の権威あるベンチマークテストにおいて、文心5.0の言語およびマルチモーダル理解能力はグローバルなトップクラスのモデルであるGemini-2.5-ProやGPT-5-Highと同等であり、画像および動画生成能力は専門分野において世界をリードしていることが示されています。これは、ネイティブ・フルモーダル大規模モデルの実力を十分に示しています。

百度の創業者である李彦宏氏は、発表会で大規模モデル技術が急速に進化しており、その知能レベルが次々と境界を突破していると述べました。彼は、今後、自己学習と創造的な能力を持つようになることを強調し、技術の進化速度が百度の核心競争力であると語りました。また、より高度な知能モデルを開発し、全体的な知能レベルを向上させるために継続的に投資していくことを表明しました。

現在、ユーザーは文心アプリで文心5.0の機能を直接体験できます。開発者や企業ユーザーは、百度の千帆大モデルプラットフォームからAPIサービスを呼び出して利用可能です。

ポイント:

- 🚀 文心5.0はネイティブ・フルモーダル技術を採用しており、テキスト、画像、音声、動画などの情報の理解と生成をサポートしています。

- 📈 権威あるベンチマークテストにおいて、文心5.0のマルチモーダル理解能力は世界トップクラスのモデルと同等であり、大きな潜在能力を示しています。

- 🌐 ユーザーは文心アプリで新モデルを体験でき、開発者はAPIサービスを呼び出して、スマートアプリケーションの開発を促進できます。