百度は再び先駆者としての立場を取っています。10月15日に、百度検索は文心アシストの大幅なアップグレードを正式に発表しました。このアップグレードにより、AIGC(人工知能生成コンテンツ)のマルチモーダル創作およびスマートタスク解決能力が顕著に強化されました。今回の更新により、文心アシストは文章の生成だけでなく、AI画像、動画、音楽、ポッドキャストなど8種類の異なるコンテンツの作成も可能となり、AIクリエーション分野における新たな時代を切り開きました。
データによると、文心アシストを使用するユーザーが毎日生成するAIGCコンテンツ量はすでに千萬を超えたとのことです。今回のアップグレードでは、業界初のオープンなリアルタイム対話型デジタル人間インテリジェントエージェントが登場しました。高精細な姿と低遅延の感情インタラクション機能を備え、ユーザーに対してより専門的なコンテンツとサポートサービスを提供し、人とAIの相互作用をより生き生きと親しみやすいものにします。

ユーザー体験面では、文心アシストは短いコンテンツから長時間のビデオまでカバーしています。一言の入力だけで、3分間のドラマショートフィルムを生成でき、AIは物語の構成、キャラクターの設定、シーンの構築、カメラワーク、BGMなどのすべてのプロセスを自動で行います。また、助手には「一言で曲を書く」「MV制作」などの創造的な機能が統合されており、30種類以上のエフェクトテンプレートを提供し、クリエーションをより簡単で楽しくしています。
技術的には、百度が自社開発した「スチームマシン」モデルがAIビデオのリアルタイム対話生成において大きな進歩を遂げました。伝統的なAIビデオの10秒という制限を初めて突破し、「無制限の長さ」の生成を実現しました。ユーザーは一枚の画像をアップロードし、説明文を入力することで、リアルタイムで生成された内容をプレビューできます。必要に応じていつでも停止や編集が可能です。「双方向の共創」の能力により、AIビデオの制作は新たな段階に入りました。
さらに、文心アシストは相互作用可能なデジタル人間とオープンワールドの動的構築という2つの新機能を導入しました。デジタル人間は双方向の没入型インタラクションができ、販売、教育、サポートなどの場面で利用可能です。一方、オープンワールドでは、AIが生成した仮想空間内で自由に探索することが可能となり、AIGCの現実世界と仮想世界の融合における応用可能性を広げました。
これらのアップグレードとイノベーションにより、文心アシストは現在最も強力なAIクリエーションツールの一つとなりました。今後の展開に期待が高まります。
