中国のAIスタートアップ企業ミネックスが開発した最新の動画生成モデル「ハイルオ2.3」が、Replicateプラットフォームで正式にリリースされました。このアップグレード版は、非常にリアルな物理シミュレーションとスムーズな動作キャプチャ能力を備えており、AIコンテンツ制作分野で注目を集めています。
このモデルはテキストおよび画像入力から高品質な動画を生成でき、AIが動的ビジュアル効果においてまた一つの突破を遂げたことを示しています。特に映画制作、広告、デジタルエンターテインメントに適しています。ハイルオ2.3は、前バージョンのハイルオ02に採用されているNoise-Aware Computation Redistribution(NCR)アーキテクチャを引き継ぎ、トレーニング効率が2.5倍向上し、最大10秒間のネイティブ1080p動画出力をサポートしています。
プラットフォームのデータによると、このモデルは世界中の動画生成ベンチマークテストで上位にランクインしており、グーグルのVeo3を上回り、独立画像から動画へのベンチマークでも優れた性能を発揮しています。Replicateは先進的なAIモデルホスティングプラットフォームであり、その統合により開発者やクリエイターはAPIを通じて簡単にこのツールにアクセスできます。価格は手頃で、6秒の1080p動画の平均コストは約1.5ドルです。今回のアップデートの主な特徴は、人体の物理的および動作の精緻なシミュレーションです。モデルは、転ぶ、踊るなどの複雑でスムーズな動作を生成でき、リズム感と自然な流体感を捉え、雨の中のネオンライトの下でのダンサー、または中世市場の夕暮れの動的な詳細までシミュレーションできます。
さらに、ハイルオ2.3は映画級のビジュアルエフェクトを導入し、爆発、膨張、群衆の動き、織物の質感などの物理現象をサポートします。スタイル変換と超現実的なスタイル化にも対応し、ユーザーが製品紹介からストーリーテリングの短編映画まで、迅速にアイデアを試行錯誤できるようにします。細部の処理では、明瞭度と一貫性が大幅に向上しました:テキストレンダリングがより鋭く、顔や物体がフレーム間で安定し、微表情の豊かさが大幅に増加し、会話シーンにおける感情反応を捉えることができます。
また、プロンプトの遵守性がより厳格になり、ユーザーが入力した説明文「低角度の日差しの中で波乗りをする人」が正確に連続する動画に変換されるようになります。これにより、過去の生成で見られた誤差を避けることができます。
ハイルオシリーズは2025年初頭にリリースされて以来、Redditや専門フォーラムで積極的なフィードバックを得ており、広告のプロトタイプやVFXテストでの実用性が評価されています。現在、動画の長さは最大10秒に制限されていますが、物理的な正確性と多言語プロンプトのサポート(英語以外の言語も最適化)により、モバイルコンテンツ制作、例えばiOSやAndroidアプリなどにも適しています。
