今日の百度文心 момент カンファレンスで、百度は待ちに待った文心大モデル5.0を正式にリリースしました。2.4兆パラメータを持つこの「巨大な」モデルは、百度が人工知能分野で歴史的な飛躍を遂げたことを示し、マルチモーダル統合から「ネイティブフルモーダル」へと転換しました。

image.png

業界で一般的な「後合成」アプローチとは異なり、文心5.0はネイティブフルモーダル統一モデリング技術を使用しています。テキスト、画像、動画、音声データを単一の統一された自己回帰アーキテクチャ内で共同トレーニングします。この技術的アプローチにより、モデルは人間のようにマルチモーダル特徴の深い統合を実現し、機械の理解と生成能力がより自然で同期的にされます。

実際の応用シナリオにおいて、文心5.0は驚くべき知能を示します。コードの作成や創造的な執筆を簡単に処理でき、短いアプリチュートリアル動画からインタラクションロジックを正確に分解し、直接実行可能なフロントエンドコードを生成できます。さらに、論理的推論や状況作成においても大きな進歩があり、特定の古典的な文学スタイルを完璧に模倣して現代のビジネスロジックを処理することができます。

image.png