エージェント型インテリジェンスの分野で画期的な出来事となりました。上海市ネットワーク情報管理弁公室の最新公告によると、Zhiyuan社のWITA(シリコン光動語)大規模モデルはすでに登録を完了し、全国で初めて規制に適合して実用化されたエージェント型インテリジェンス対話大規模モデルとなりました。
これは単なる「資格取得」ではありません。WITAの核心的な使命は、人形ロボットが本当に「会話ができ、感情を理解し、個性を持つ」ことにあるのです。このモデルはロボットのインタラクションシーンに焦点を当て、自然で人間のような感情表現を通じて、冷たい機械体を連続的な記憶を持ち、人格的特徴を持つ「シリコンパートナー」に進化させます。このモデルは、「インタラクティブなインテリジェンスの配置態勢」のコアエンジンであり、すでに案内や販売、サービス小売などの商用シーンに導入され、ロボットが「作業はできるが会話はできない」という業界の課題を解決しています。

さらに注目すべきは、Zhiyuanが今年第3四半期にWITA Omni1.0を発表する予定であることです。これは業界初のロボットネイティブなエンドツーエンドのマルチモーダルインタラクション大規模モデルです。その革新点は明確です:インタラクション遅延を500ミリ秒以内に短縮し、ほぼ人と同じペースで会話ができ、通常の速度で連続した会話を可能にし、いつでも割り込みや中断、修正が可能です。感情とトーンもリアルタイムで応え、インタラクションを本質的に「人と話しているように」します。
技術的には、新モデルは言語、音声、表情、動作のマルチモーダル協調を実現し、これまでの「口だけ動くが体は動かない」という違和感を解消しました。さらに重要なのは、マルチモーダルインタラクションデータのフィーリングメカニズムを通じて、モデルが現実的なシナリオで継続的に学習し、使用するたびに賢くなることで、自己進化する正のサイクルを形成することです。
