【AI日報】へようこそ!ここは毎日人工智能の世界を探索するためのガイドです。毎日、AI分野のホットな情報を提供し、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新規のAI製品クリックして詳細を確認https://app.aibase.com/zh

1、AIオーディオドラマの革命が起こった!ドウバオが自動で複数声優システムをリリース、98%のキャラクター認識精度、プロのラジオドラマと同等の品質

記事では、ドウバオの音声チームがリリースした「AIマルチキャラクターオーディオドラマ」の自動制作ソリューションについて紹介しています。このソリューションは、元の小説テキストから高品質なラジオドラマを自動生成でき、人間の介入なしで行うことが可能です。その核心は、高自然度の多キャラクター音声合成エンジンで、キャラクターを正確に識別し、性格や感情に合ったトーンを付与します。また、スマートに背景音楽やサウンドエフェクトを追加し、没入感を高めます。この技術は「トマト小説」アプリで導入され、ユーザーからの反響が大きく、AIが音声コンテンツ分野で大きな進展を遂げたことを示しています。

image.png

【AiBaseの要約:】

🤖 AIマルチキャラクターオーディオドラマの自動制作ソリューション、エンドツーエンドの無人制作を実現。

🔊 高自然度の多キャラクター音声合成エンジン、キャラクター認識精度は98%以上。

🎼 スマートに背景音楽とサウンドエフェクトを追加し、映画のような没入感のある聴覚体験を提供。

2、Adobe Firefly Image 5の大幅アップグレード:400万ピクセルのネイティブ生成、AI音軌+カスタムモデル、クリエイターが「フルスタック」なAI創作時代を迎える

Adobe Firefly Image 5のリリースにより、AI画像生成はプロフェッショナルレベルの競争市場へと進出しました。このバージョンは400万ピクセルのネイティブ出力をサポートし、階層付きのヒント編集、カスタムアートスタイルモデル、およびAI音声とBGM生成機能を提供することで、画像、動画、音声のAI創作フローを完全に統合しています。

image.png

【AiBaseの要約:】

🔥 Firefly Image 5は400万ピクセルのネイティブ生成をサポートし、画像品質と細部表現を大幅に向上させました。

🎨 ユーザーは独自のアートスタイルモデルを訓練できるため、出力内容が個人の芸術的言語に合います。

🎵 AI音声とBGM生成機能を新たに搭載し、ElevenLabsの音声モデルと統合し、創作のハードルを下げています。

3、Soulの音声モデルSoulX-Podcastが衝撃的に登場:90分間中断なしのポッドキャスト生成、AI音声の革命が再び進化

SoulX-Podcast音声モデルのリリースは、AI音声技術がポッドキャスト分野で大きな進歩を遂げることを意味しています。その高保真度、安定性、そして多言語対応は、コンテンツ作成の新たな可能性を提供します。

image.png

【AiBaseの要約:】

🎙️ 中英両語および方言に対応し、多言語ポッドキャストの生成が可能。

🔊 90分間の中断なしの音声生成を実現し、ポッドキャストの品質を向上。

🗣️ ゼロサンプルクローン技術を採用し、パーソナライズされた音声カスタマイズが可能。

詳細リンク:https://github.com/Soul-AILab/SoulX-Podcast

4、360が世界初のL2-L4全スタックインテリジェントプラットフォームを発表!政府・企業のAI転換が「即時利用」時代へ

360グループは世界初のL2-L4全スタックインテリジェントプラットフォームを発表し、政府および企業向けの包括的なAI実装ソリューションを提供することを目的としています。これは、政府および企業がインテリジェントボディを取り入れる際に直面する三大障壁を解決し、業界生態系連携計画を開始し、産業への浸透を加速させています。

image.png

【AiBaseの要約:】

🧠 360が世界で初めてL2からL4までのすべての段階の能力をカバーするインテリジェントボディオペレーティングシステムを発表し、インテリジェントボディが個別の突破から大規模な複製へと移行するのを推進しています。

🔒 SEAFインテリジェントボディファクトリーはプライベート配置と信創環境の適合性をサポートし、データは領域内に残り、モデルは監査可能であり、政府・企業が「使えない」「使いにくい」「安心できない」という問題を解決します。

🤝 「千行業界生態系連携計画」を開始し、ソフトウェア・ハードウェアメーカー、システム統合商、業界ISVと協力し、標準化されたインテリジェントボディソリューションを作り出します。

5、IBMがGranite 4.0 Nanoモデルを発表、小型AIモデルの性能限界を突破

IBMは4種類の新しいGranite 4.0 Nanoモデルを発表しました。これらのモデルは通常のノートパソコンやブラウザでローカルで動作でき、同社が人工知能分野での効率性とアクセス性への重視を示しています。すべてのモデルはApache2.0ライセンスで公開され、研究者、企業、独立開発者に適しており、商用用途にも対応しています。

image.png

【AiBaseの要約:】

🧠 IBMがGranite 4.0 Nanoモデルを発表し、一般的なハードウェア上で動作可能で、小型AIモデルの可用性を向上させました。

🛠️ すべてのモデルはApache2.0ライセンスで公開され、研究や商用用途に適しており、オープン性と互換性を確保しています。

📈 最新のベンチマークテストでは、Granite 4.0モデルが同様の製品を上回る性能を示し、高い処理能力を証明しています。

詳細リンク:https://huggingface.co/blog/ibm-granite/granite-4-nano

6、2025年第3四半期のAIアプリ市場状況:モバイル端末ユーザーが7億人に達し、豆包がネイティブAIアプリ月間アクティブユーザー第1位を獲得

2025年第3四半期のAIアプリ市場は強烈な成長傾向を示し、モバイル端末のAIアプリユーザー数が7億人に達しました。その中でもAIアプリケーションプラグインの成績が特に目立ちました。一方で、PCアプリの成長率は緩やかで、わずかなアプリのみが正の成長を記録しています。

image.png

【AiBaseの要約:】

📱 モバイルAIアプリユーザーが7億人に達し、主にベンダーのモデル改善とエコシステム協調によるものです。

🚀 AIアプリケーションプラグインの成績が突出しており、特に月間アクティブユーザーでトップを維持しています。

📉 PCアプリの成長率が低下し、85%以上のウェブアプリの月間アクティブユーザーが50万人未満です。

7、PayPalとOpenAIが提携、ChatGPTが最初の統合支払いプラットフォームに

PayPalとOpenAIは重要な提携を結び、ChatGPTが最初の統合支払いプラットフォームとなることで、オンラインショッピングの利便性を大幅に向上させ、スマート代理型ECの発展を促進します。

image.png

【AiBaseの要約:】

🤖 ChatGPTはPayPalの最初の統合決済ウォレットとなり、ユーザーはここで直接買い物と支払いを行えます。

💰 PayPal株価は取引前で15%以上上昇し、市場が提携を高く評価していることを示しています。

🛍️ OpenAIはChatGPTのEC機能を拡張しており、Shopify、Etsy、ウォルマートなどと提携しています。

8、GoogleがAI自動マーケティングツールPomelliを発表、ウェブサイトURLを入力するだけでマーケティングコンテンツを生成

GoogleとDeepMindが共同でリリースしたPomelli AIツールは、中小企業がブランドに合ったソーシャルメディアマーケティングコンテンツを迅速に生成するのを支援し、マーケティングのハードルを下げるだけでなく、効率を向上させます。

image.png

【AiBaseの要約:】

🧠 ブランド分析:ウェブサイトと画像をスキャンし、総合的なブランドイメージを作成。

💡 クリエイティブ生成:ブランドDNAに基づき、ターゲット向けのマーケティングアイデアを自動生成。

🎨 資産出力:高品質なマーケティング資産を生成し、リアルタイム調整も可能。

詳細リンク:https://labs.google.com/u/0/pomelli/about/