ロンドンのスタートアップ企業Stability AIは、潜在拡散技術を用いて最長90秒の高品質な商業音楽を生成できるAI音楽生成ツール「Stable Audio」を発表しました。
Stability AIは商業音楽ライブラリAudioSparxと提携し、Stable Audioに約80万曲の音楽を提供しています。ユーザーは様々なサブスクリプションプランを選択し、商業音楽を生成し、音楽ライブラリとの収益分配を行うことができます。

ロンドンのスタートアップ企業Stability AIは、潜在拡散技術を用いて最長90秒の高品質な商業音楽を生成できるAI音楽生成ツール「Stable Audio」を発表しました。
Stability AIは商業音楽ライブラリAudioSparxと提携し、Stable Audioに約80万曲の音楽を提供しています。ユーザーは様々なサブスクリプションプランを選択し、商業音楽を生成し、音楽ライブラリとの収益分配を行うことができます。
AI音楽生成ツールUdioがV1.5バージョンをリリースしました。音質が大幅に向上し、重要な音程制御機能の導入により、より正確な音楽制作が可能になりました。新モデルは多言語に対応し、ユーザーの裾野を広げます。Udioは、専用の制作ページ、音楽片段のダウンロード、オーディオからオーディオへのリミックス機能、共有可能な歌詞ビデオなど、製品機能も強化し、音楽制作の可能性を広げます。今回のアップデートは、音楽の質を高めるだけでなく、ユーザーエクスペリエンスも向上させ、音楽制作者にとって強力なツールとなっています。
動画生成分野では、近年目覚ましい進歩を遂げていますが、既存の生成モデルは、複雑な動き、ダイナミクス、物理現象をリアルに捉えることが依然として困難です。この限界は、主に従来のピクセル再構成目標に起因しており、この方法は外観のリアリティを高めることに偏り、運動の一貫性を無視することが多いためです。この問題を解決するために、Metaの研究チームは、モデルによる結合外観・運動表現の学習を促進することで、ビデオ生成モデルに有効な運動能力を注入することを目的とした、VideoJAMという新しいフレームワークを提案しました。
先日、PramaLLCは最新の人工知能モデルである背景除去ネットワークBEN2(Background Erase Network)を発表しました。このモデルは前景分割技術において顕著な革新をもたらしています。BEN2は信頼性誘導マット化(Confidence Guided Matting、CGM)パイプラインを採用しており、洗練されたネットワークを使用して基本モデルの信頼性が低いピクセルを処理することで、より正確で信頼性の高いマット化効果を実現します。BEN2の訓…
2月8日、Tencent Cloudは画期的なイノベーションを発表しました。DeepSeekのR1およびV3オリジナルモデルをAPIインタフェースを介してTencent Cloudの大規模モデル知識エンジンに統合し、联网検索機能をサポートします。この取り組みにより、Tencent Cloudは国内で初めてこのような機能を実現したクラウドサービスプロバイダーとなり、企業レベルのAIアプリケーションの迅速な構築と展開のための全く新しいソリューションを提供します。
テンセントクラウドは、深度求索(DeepSeek)大規模言語モデルとの深度統合を完了したことを発表しました。DeepSeek-R1とV3のオリジナルモデルのAPIインターフェースを正式にリリースし、独自開発の大規模言語モデル知識エンジンを革新的に導入、同時にインターネット検索機能も開放しました。これにより、テンセントクラウドは中国で初めて「モデルAPI+知識エンジン+リアルタイム検索」の三位一体サービスを実現したクラウドプロバイダーとなり、大規模言語モデルアプリケーションが動的知識強化時代へ本格的に突入したことを示しています。