Colossal-AIは、Soraの完全な再現アーキテクチャソリューションであるOpen-Soraをオープンソース化しました。これは、再現コストを46%削減し、モデルトレーニングの入力シーケンス長を819Kパッチに拡張できると主張しています。Soraアルゴリズムの再現ソリューションは、Soraの技術レポートに記載されています。Soraは、様々なサイズのビデオを潜在空間の时空ブロックシーケンスに圧縮するビデオ圧縮ネットワークを使用し、次にDiffusion Transformerを使用してノイズを除去し、最後にデコードしてビデオを生成します。Open-Soraは、データ処理からトレーニング推論までの全プロセスを含む、Soraが使用する可能性のあるトレーニングパイプラインを包括的に提供し、完全なSora再現アーキテクチャソリューションを提供します。現在、Open-Soraは、データ処理からトレーニング推論までの全プロセスを含む完全なSora再現アーキテクチャソリューションを提供しており、動的解像度、複数のモデル構造、複数のビデオ圧縮方法、複数の並列トレーニング最適化をサポートしています。性能面では、単一のH800 SXM 8*80GB GPU上でDiT-XL/2モデルを使用した性能テストを例にとると、600Kのシーケンス長において、Open-Soraのソリューションは、ベースラインソリューションと比較して40%以上の性能向上とコスト削減を実現しています。Open-Soraのオープンソースアドレス:https://github.com/hpcaitech/Open-Sora
関連推奨
GPT-4oレベル!VITA-1.5:リアルタイムなビジュアルと音声インタラクション、1.5秒のインタラクション遅延
VITA-MLLMチームは最近、VITA-1.0をベースに開発されたアップグレード版であるVITA-1.5を発表しました。マルチモーダルインタラクションのリアルタイム性と正確性の向上を目指しています。VITA-1.5は英語と中国語に対応しているだけでなく、複数の性能指標において顕著な向上を実現し、よりスムーズなインタラクション体験を提供します。VITA-1.5では、インタラクション遅延が大幅に短縮され、従来の4秒からわずか1.5秒に短縮されました。ユーザーは音声インタラクションを行う際に、ほとんど遅延を感じません。
豆包ビデオモデルPixelDance公開後、OpenAIが焦る?Soraの大幅アップグレードを発表
OpenAIは先日、ビデオAI分野で再び大きな話題を呼びました。同社は2月に公開したSoraの大幅なアップグレードを進めているのです。中国の情報日報の報道によると、今回のアップグレードの主な目的はSoraの性能を大幅に向上させ、より長く、より高品質なビデオコンテンツをより迅速に生成できるようにすることです。Soraの最初のバージョンは、確かに多くの問題を抱えていました。初期バージョンでは、短いビデオの生成に10分以上かかるなど、実用的な応用には程遠い効率性でした。さらに深刻な問題は…
AI開発者歓喜!Google Gemini 1.5 アップグレード:性能大幅向上、価格は半額
Googleは本日、Gemini-1.5-Pro-002とGemini-1.5-Flash-002を含む、アップグレードされたGeminiモデルシリーズを発表しました。今回のアップデートでは、性能の大幅な向上に加え、驚くべき価格値下げを実現し、AI開発業界に大きな波を起こすことは間違いありません。まず、最も注目すべきは価格の大幅な引き下げです。新モデルの使用コストは半額以下に、50%以上も削減されました。同時に、性能も大幅に向上しています。Gemini 1.5 Flash
Mistral AI、Llama 405Bに迫る大規模言語モデルMistral Large 2を発表
Mistral AIは最近、最新世代の大規模言語モデルMistral Large 2を発表しました。このモデルは、コスト効率、速度、性能において顕著な進歩を遂げています。Mistral Large 2は1230億パラメーターを持ち、128Kのコンテキストウィンドウを備えています。英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、アラビア語、ヒンディー語、ロシア語、中国語、日本語、韓国語など数十の言語、そしてPython、Jaをサポートしています。
NVIDIA、新型RTX 500および1000 GPUチップを発表、AIGC性能が1400%向上
NVIDIAが新型RTX 500および1000 GPUチップを発表。AIGC性能が1400%向上。RTX 500は、世界標準搭載で価格が最も手頃な高性能AIGC対応GPUのエントリーモデルとなります。性能向上と、世界標準搭載によるAIGC機能、そして手頃な価格が消費者の注目を集めています。
