Stability AIがAI音楽生成ツール「Stable Audio」を発表

ロンドンのスタートアップ企業Stability AIは、潜在拡散技術を用いて最長90秒の高品質な商業音楽を生成できるAI音楽生成ツール「Stable Audio」を発表しました。

Stability AIは商業音楽ライブラリAudioSparxと提携し、Stable Audioに約80万曲の音楽を提供しています。ユーザーは様々なサブスクリプションプランを選択し、商業音楽を生成し、音楽ライブラリとの収益分配を行うことができます。

AI音楽生成ツールUdioがV1.5にアップデート、モデルの音質が大幅に向上

AI音楽生成ツールUdioがV1.5バージョンをリリースしました。音質が大幅に向上し、重要な音程制御機能の導入により、より正確な音楽制作が可能になりました。新モデルは多言語に対応し、ユーザーの裾野を広げます。Udioは、専用の制作ページ、音楽片段のダウンロード、オーディオからオーディオへのリミックス機能、共有可能な歌詞ビデオなど、製品機能も強化し、音楽制作の可能性を広げます。今回のアップデートは、音楽の質を高めるだけでなく、ユーザーエクスペリエンスも向上させ、音楽制作者にとって強力なツールとなっています。

Metaの新フレームワークVideoJAM：AIビデオモデルの運動能力と物理能力を向上

動画生成分野では、近年目覚ましい進歩を遂げていますが、既存の生成モデルは、複雑な動き、ダイナミクス、物理現象をリアルに捉えることが依然として困難です。この限界は、主に従来のピクセル再構成目標に起因しており、この方法は外観のリアリティを高めることに偏り、運動の一貫性を無視することが多いためです。この問題を解決するために、Metaの研究チームは、モデルによる結合外観・運動表現の学習を促進することで、ビデオ生成モデルに有効な運動能力を注入することを目的とした、VideoJAMという新しいフレームワークを提案しました。

オープンソース背景除去モデルBEN2、画像と動画の背景除去が可能

先日、PramaLLCは最新の人工知能モデルである背景除去ネットワークBEN2（Background Erase Network）を発表しました。このモデルは前景分割技術において顕著な革新をもたらしています。BEN2は信頼性誘導マット化（Confidence Guided Matting、CGM）パイプラインを採用しており、洗練されたネットワークを使用して基本モデルの信頼性が低いピクセルを処理することで、より正確で信頼性の高いマット化効果を実現します。BEN2の訓…

深Seek-R1、V3オリジナルモデルAPIインタフェースをサポートする联网検索機能付きのTencent Cloudがリリース

2月8日、Tencent Cloudは画期的なイノベーションを発表しました。DeepSeekのR1およびV3オリジナルモデルをAPIインタフェースを介してTencent Cloudの大規模モデル知識エンジンに統合し、联网検索機能をサポートします。この取り組みにより、Tencent Cloudは国内で初めてこのような機能を実現したクラウドサービスプロバイダーとなり、企業レベルのAIアプリケーションの迅速な構築と展開のための全く新しいソリューションを提供します。

テンセントクラウド、DeepSeek全シリーズAPIインターフェースをリリース、インターネット検索機能と統合