商湯テクノロジーは、Seko2.0を正式にリリースしました。これは、世界初のマルチエピソード動画生成に特化したスマートエージェントであり、AIによる動画生成が単一のクリップ作成から連続的な物語構築へと進化したことを示すものです。このシステムは、キャラクター、シーン、スタイルが非常に統一された複数話のショートビデオコンテンツを生成でき、ストーリーのつながり、人物の安定性、視覚の一貫性において業界で大きな突破を遂げました。これにより、ショートドラマ、広告、教育などの場面に対してスケーラブルなAIコンテンツ制作のソリューションが提供されます。

Seko2.0の背後には、商湯が自社開発した「日日新Seko」シリーズの多モーダル大規模モデルの深い協働があります。その中で、SekoIDXは高精度な画像生成とキャラクターのモデリングを担当し、SekoTalkは音声駆動の口唇同期と感情表現を持つビデオ合成に注力しています。これらは長距離の一貫性のあるビデオ生成を支える技術的基盤となります。フレーム間の注意メカニズムとキャラクター記憶モジュールを通じて、Seko2.0は、異なるエピソードにおける同一キャラクターの外見、服飾、そして微表情の連続性を確保し、現在のAIビデオツールで一般的に存在する「顔入れ替えの崩壊」と「ストーリーの断絶」の問題を効果的に解決します。

さらに注目すべきは、Sekoシリーズモデルが中国国内のAIチップである寒武紀の全面的な互換性を達成したことです。これは、言語大規模モデルから多モーダル生成、特に高演算能力が必要な動画生成に至るまで、中国製の演算プラットフォームがAIGCの核心的な生産シナリオを初めて完全にサポートしたことを意味します。この突破は、海外GPUへの依存を減らすだけでなく、中国のAIエコシステムが「ハードウェア-モデル-応用」のチェーンにおいて重要なクローズドループが形成されていることを示しています。

開発者やコンテンツクリエイターにとって、Seko2.0は単なる効率向上ツールだけでなく、新たなコンテンツの形態も提供しています。物語の概要を入力するだけで、AIは複数話にわたる対話付きでキャラクターが継続するショートビデオシーケンスを自動生成できます。また、中国製チップの展開能力に依拠して、この機能はローカル化やプライベートな環境にも下がり、データのセキュリティと自主制御が求められる政府機関、金融機関、メディア機関のニーズに対応可能です。

単一のフレーム画像から連続するエピソード、汎用的な生成からキャラクター記憶、海外の演算能力に頼るのではなく中国製チップに完全に適合する——商湯のSeko2.0のリリースは、技術革新の重要なマイルストーンであり、中国のAI産業チェーンでの協調的なイノベーションの重要な検証でもあります。AIが「キャラクターを記憶し」「長編の物語を語る」ようになると、視覚コンテンツの工業化生産時代が本当に訪れるかもしれません。