
画像提供元:AI生成、画像許可サービス Midjourney


画像提供元:AI生成、画像許可サービス Midjourney
AI音楽生成企業Suno AIのCEO、ミッキー・シュルマン氏が最近「20VC」ポッドキャストで発言し、大きな議論を呼んでいます。彼は「今の音楽制作はそれほど楽しくない」と述べ、大多数の人が音楽制作のプロセスを楽しんでいないと考えていると主張しました。音楽制作には多くの時間と労力がかかり、楽器や制作ソフトウェアの習得も困難であると指摘。シュルマン氏の発言は、Suno AIが従来の音楽制作に苦労する人々をターゲットにしていることから、自己都合的なものだと見なされています。
最近、AI音楽生成会社Suno AIのCEO、ミッキー・シュルマン(Mikey Shulman)氏が『20VC』ポッドキャストで注目を集める発言をしました。同氏は、音楽制作を楽しむ人は少数派であり、多くの場合、煩雑で時間のかかる作業だと感じていると主張しています。シュルマン氏によると、音楽制作には多くの時間と練習が必要で、楽器や制作ソフトを習得しなければならず、それが挫折感を招くことが多いとのことです。画像出典:AI生成画像、画像使用許諾済
先ごろ、グーグル ディープマインドのチームとブラウン大学は、『力プロンプティング』と呼ばれる新しい技術を開発しました。この技術は、3Dモデルや物理エンジンがなくても本物そっくりの動きを再現できるものであり、人工知能によるビデオ生成分野における大きな進展を示しています。この技術を使用すると、ユーザーは力の方向と強度を指定するだけで、AIによって生成されたビデオコンテンツを制御できます。力プロンプティング技術は、全体的な力(例:全体風力)や局所的な力を適用することができます。
キャプションズは、その初のイノベーティブなプロダクト「ミラージュスタジオ」を正式に発表しました。これは新しいマルチモーダル基礎モデル「ミラージュ」に基づいて開発されたビデオ生成ツールであり、クリエイティブチーム向けの画期的なビデオ制作ソリューションを提供します。この製品は、非常にリアルな仮想キャラクター生成能力と広範な活用可能性により、人工知能がビデオコンテンツ制作分野で大きな進展を遂げたことを示しています。ミラージュスタジオの主な機能は、単一の人物写真から仮想アクターのビデオを素早く生成できることです。
最近、智源研究院は上海交通大学など複数の機関と共同で、新一代の超長尺ビデオ理解モデルであるVideo-XL-2を正式にリリースしました。このモデルの登場により、ロングビデオ理解技術においてオープンソース分野で大きな突破を達成し、マルチモーダル大規模モデルがロングビデオコンテンツの理解分野で新たな活力をもたらしました。技術アーキテクチャ面では、Video-XL-2は主に視覚エンコーダー、ダイナミックトークン合成モジュール(DTS)、および大規模言語モデル(LLM)という3つの主要コンポーネントで構成されています。このモデルはSigを採用しています