国内の権威ある大規模モデル評価基準である SuperCLUE が最新の総合報告書を発表しました。評価結果によると、バイトダンス傘下のドウバオ(Doubao-pro)は強力なパフォーマンスを示し、グローバルな大規模モデルの第一グループにランクインし、国際的なトップモデルと直接対決することができました。
また、小米が秘匿して開発していたMiMo 大モデルも初めてリストに登場し、業界でスマホ製造元が自社開発した大規模モデルの能力に対する関心を高めました。

中国モデルの集団的進化:GPT-4と比較可能な多面的な能力
今回の評価において、中国の大規模モデルは中国語の文脈理解、常識推論および論理的導出において顕著な進歩を遂げました。ドウバオは基礎的な会話品質において優れたパフォーマンスを示すだけでなく、複雑なタスク計画や長文処理における安定性にも高い評価を得ています。
その後を追う百度の文心一言やアリババの通義千問などのモデルも依然として上位に位置しています。これは、トップメーカーが語料の蓄積と対話技術において深い実績を持っていることを示しています。
注目すべきは、小米のMiMoがリストに登場したことで、エッジAIとクラウド大規模モデルの統合が実現されているということです。これにより、今後のスマートフォンのインタラクションにさらに多くの可能性が生まれることになります。
差別化競争:汎用知能から垂直分野への浸透
評価報告書は、現在の中国語の大規模モデル競争は単なるパラメータ数の積み重ねではなく、より細分化されたシナリオでの競争に移行していると指摘しています。
ドウバオはバイトダンスのエコシステムの流量の優位性を活かし、コンテンツ作成やソーシャルインタラクションのシナリオで突出した性能を発揮しています。一方、小米のMiMoはシステムレベルのスケジューリングとマルチデバイス協働において独自の優位性を示しています。
