Open-Sora Planがさらに進化しました!最新版Open-Sora Plan v1.2では、新しい3D全注意機構が導入され、物理世界に対する理解力が向上しました。

今回のアップデートの主なハイライト:

全く新しい3D全注意機構:新しい機構により、AIの物理世界に対する理解力は飛躍的に向上しました。「二次元コード」のように平面的にしか考えられない時代は終わりを告げ、360度全方位で立体世界を理解できるようになりました!

テキストから動画生成機能の向上:テキストを入力するだけで、AIが生き生きとした動画を生成します。

解像度と一貫性の向上:新しい機構と最適化されたVAE構造により、Open-Soraで生成される動画の画質が向上し、内容の一貫性も高まりました。ぼやけた動画とはお別れです!

空間と時間の完璧な融合:新しい3D全注意機構により、以前のバージョンで課題となっていた空間次元と時間次元の同時処理が解決されました。これは何を意味するのでしょうか?生成される動画の空間表現と時間的なスムーズさが大幅に向上することを意味します!

推論速度の大幅な向上:最適化されたCausalVideoVAE構造は、モデルのパフォーマンス向上だけでなく、推論速度も劇的に向上させました。効率重視の方にも朗報です!

image.png

Open-Soraの開発の歴史を振り返ると、その進歩の速さに驚かされます。2024年5月には、v1.1.0版では2+1Dモデルアーキテクチャを使用しており、主に探索的なトレーニングに使用されていました。それからわずか数ヶ月後、今では3Dの世界を作り出す「創造主」へと進化しました!このスピードは、ダーウィンでさえ「進化論を書き換えなければならない!」と叫ぶでしょう!

素晴らしいことに、Open-Soraチームは惜しみなく技術を公開しています!コード、データ、モデルすべてがオープンソースです。「世界を創造する方法」の説明書をあなたの顔に貼り付ける寸前です。彼らの目標はシンプルです。誰もが動画制作の「神」になれるようにすることです!このオープンで共有する姿勢は、AIによる動画生成技術の進歩を間違いなく加速させるでしょう。

Open-Sora Plan v1.2.0のリリースは、動画生成モデルが新たな時代に入ったことを示しています。視覚表現の圧縮と推論効率が大幅に向上しただけでなく、将来の発展の方向性も示しています。

プロジェクトアドレス:https://top.aibase.com/tool/open-sora-plan-v1-2