身体知能と大規模モデルの統合がさらに進展。チエイエンロボティクスは最近、ミニマックス(シャンハイシーユー科技)と戦略的協力関係を結び、ミニマックスがチエイエン人形ロボットにエンドツーエンドのテキストから音声(TTS)を提供し、ロボットが現実的な場面での自然なインタラクション能力と感情表現レベルを著しく向上させることになりました。

 全フロー音声の強化により、「話せる」スマートエージェントを構築

今回の提携は、音声合成のコア技術に焦点を当てています。ミニマックスは高自然度の音声生成、多様な感情調子のモデリング、低遅延リアルタイム推論などの先進的な能力を、チエイエンロボティクスのシステムに深く統合します。これにより、チエイエン人形ロボットは:

- ほぼ人間のようなスムーズな口調で会話を行うことができます;

- 上下文に基づいて喜び、心配、厳粛などの感情のトーンを自動的に切り替えることができます;

- 複雑なノイズ環境でも低遅延かつ高解像度の音声出力を実現し、人間とロボットのコミュニケーション効率を確保できます。

この技術はまず、チエイエンが家庭サービス、商業案内、医療介護などのシーンで使用するロボット製品に導入されます。これにより、AIは「見える」「正しいことを行う」だけでなく、「正確に言える」「温かく話す」ことができるようになります。

 強力な連携:大規模モデル企業 × 身体知能の先駆者

ミニマックスは国内の大規模モデルの第一陣の代表企業であり、そのMoEアーキテクチャの大規模モデルと端末側の推論最適化能力はすでにスマートフォン、自動車、IoTデバイスなどで広く利用されています。一方、チエイエンロボティクスは人形ロボット本体制御、運動計画およびシーンへの適用において急速に突破しています。今回の提携は、「脳」(大規模モデル)が加速して統合されていることを示しています。

業界分析によると、音声インタラクションは人形ロボットが実用化に向かうための鍵となります。ロボットが自然で温度感のある声で人と交流できるようになると、ユーザーの受け入れ度と信頼感が大幅に向上し、商業化の道が開けます。

 AIbaseの観察:音声はもはや「補助機能」ではなく、身体知能の「魂のインターフェース」になった

現在の人の形のロボットの競争では、多くのメーカーが歩行や把持などの物理的能力に注目していますが、チエイエンとミニマックスの提携は、対話体験への重視を示しています。未来には、家や公共の場所に実際に入るロボットは、最も速く走るのではなく、最も「話せ」「心を理解する」ものになるかもしれません。