智譜AIは、OpenDayイベントで「清影(Ying)」というAI大規模モデルを発表しました。これは、任意のテキストからビデオを生成できるモデルです。清影はテキストからビデオを生成する機能を持ち、30秒以内に1440x906の高解像度ビデオを作成できます。ユーザーはテキスト(プロンプト)を入力し、カートゥーン3D、白黒、油絵、映画風など、好みのスタイルを選択するだけでビデオを生成できます。清影は既に清言アプリで公開されており、すべてのユーザーが利用できます。

テキストからビデオを生成する機能に加えて、清影は画像からビデオを生成することもできます。これにより、表情豊かな梗図、広告制作、ストーリー創作、ショートビデオ制作など、新しい可能性が生まれます。同時に、「写真を動かす」というミニプログラムも公開予定で、AIが古い写真の人物や風景を動かすことができます。

微信截图_20240726105620.png

清影APIも大規模モデルオープン平台bigmodel.cnで公開されています。企業や開発者はAPIを呼び出すことで、テキストからビデオ、画像からビデオのモデル機能を利用できます。清影は新しいDiTモデルアーキテクチャを採用しており、ビデオ情報の圧縮効率を高め、テキストとビデオの内容を効果的に融合することで、複雑な指示への遵守能力、内容の一貫性、画面の調整能力を向上させています。

智譜AIのCEOである張鵬氏はイベントで、清影の基盤となるビデオ生成モデルはCogVideoXであり、テキスト、時間、空間の3次元を融合し、Soraのアルゴリズム設計を参考にしたと述べました。CogVideoXは前世代モデルと比較して推論速度が6倍向上しており、今後、より高解像度で長時間のビデオ生成機能が提供される予定です。

ユーザーは智譜清言PC/アプリ上の「清影インテリジェントエージェント」で清影を直接体験し、アイデアを芸術的なビデオ作品に変えることができます。

体験アドレス:https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu