関連推奨
Googleの新しい音声クローン技術:数秒の音声サンプルだけで、声をクローン化
急速に発展する現代のテクノロジーにおいて、音声合成技術も進歩を遂げており、特に失われた声を回復する分野で注目されています。最近、Googleの研究者たちは「ゼロショット音声変換(zero-shot voice transfer)」と呼ばれる新しい技術を発表しました。この技術は、最先端のテキスト音声変換(TTS)システムと直接統合でき、病気や事故で声を失った人々が彼らの「声の記憶」を取り戻すのを助けます。この技術の核心は「ゼロショット」能力であり、大量のサンプルを必要とせずに実現できることを意味します。
百度AIコードアシスタント「文心一言」アップグレード:エンタープライズレベルのコードアーキテクチャ解説機能などを搭載
2024年9月25日に開催された百度雲智大会で、百度智能雲は企業向けAIアプリケーションに関する一連の大幅なアップグレードを発表しました。これは、企業がより効率的かつ経済的に大規模モデルを活用できるよう支援することを目的としています。今回のアップグレードには、百舸AI異種計算プラットフォーム4.0と千帆大規模モデルプラットフォーム3.0、そしてコードアシスタント、インテリジェントカスタマーサービス、デジタルヒューマンなどのAIネイティブアプリケーション製品の全面的な更新が含まれています。
SnapchatとGoogleが提携、My AIチャットボットにGeminiのマルチモーダル機能を搭載
Snapchatは最近、Google Cloudとの提携関係拡大を発表しました。今回の提携の中心は、SnapchatのMy AIチャットボットに、より強力な生成AI機能を追加することです。この提携により、My AIはGoogleのGemini AIのマルチモーダル機能を活用し、テキスト、音声、画像、動画など、様々な情報を理解し処理できるようになります。Snapの年次パートナーシップサミットで、SnapchatはGeminiベースの…
SpotifyのAIプレイリスト機能、米国など複数カ国で利用可能に
Spotifyは最近、米国、カナダ、アイルランド、ニュージーランドなどで新しいAIプレイリスト機能をリリースしました。この機能は当初、英国とオーストラリアのPremiumユーザー向けに提供され、好評を受けて、より多くの地域に拡大されました。使い方は簡単で、アプリ内で「家でデートに最適なロマンチックなプレイリスト」など、テキストプロンプトを入力するだけで、好みに合わせた雰囲気や気分にぴったりなカスタムプレイリストが生成されます。この機能は現在、AndroidとiOSで利用可能です。
智源研究院、中文インターネットコーパスCCI3.0を発表 1000GBのデータセットを含む
2024北京文化フォーラムにおいて、北京智源人工知能研究院(BAAI)は、新世代の中文インターネットコーパスCCI3.0(Chinese Corpora Internet)の正式発表を行いました。データの共同構築と共有を促進します。CCI3.0は1000GBのデータセットと498GBの高品質サブセットCCI3.0-HQを含み、2023年11月のCCI1.0の最初のオープンソース化、2024年4月のCCI2.0発表に続く重要なアップデートとなります。
