【AIニュース】へようこそ!ここは毎日あなたを人工知能の世界に導くガイドです。毎日、AI分野の注目情報をお届けし、開発者に焦点を当てて、技術トレンドを理解し、革新的なAI製品の応用をご紹介します。

新着AI製品クリックして詳細を確認https://app.aibase.com/zh

1. アリババが超強力な音声合成モデル「Qwen3-TTS」を発表:49種類のボイスであなたのニーズに対応!

アリババ通義千問は、新世代の音声合成大規模モデル「Qwen3-TTS」を発表しました。このモデルは49種類の多役割ボイスと10言語および方言をサポートし、高い語彙誤り率(WER)と人間らしい表現力を備えています。ポッドキャストやオーディオブック、ゲームのNPCなど様々なシーンで利用でき、商用用途にも無料でAPIを開放しています。

image.png

【AiBase要約:】

🎧 49種類の多役割ボイスがあり、性別・年齢・地域・役割設定に対応し、ワンクリックで切り替え可能

🌐 10種類の主要言語と10種類の中国方言をサポートし、跨言語WERがリード

🚀 無料で接続可能で、商用環境にも最適、APIの呼び出し回数制限なし

2. アリババが全モダル大モデル「Qwen3-Omni-Flash」を発表:リアルタイムストリーミング出力、119言語対応

アリババは全モダル大モデル「Qwen3-Omni-Flash」を発表しました。リアルタイムストリーミング対話と多言語処理をサポートし、パーソナライズされた体験とパフォーマンス向上を提供し、ライブ配信やショートビデオなどのシーンに適しています。

image.png

【AiBase要約:】

🧠 リアルタイムストリーミング全モダルインタラクション、複数言語の入力と出力をサポート

🎨 パーソナライズされた体験、System Promptのカスタマイズ権限開放

📈 パフォーマンス向上、基準テストで全体的に向上

3. Gemini TTS 2.5正式リリース:Googleが感情レベルの音声を発表、24言語+多役割ワンクリック切り替え

GoogleはGemini 2.5 FlashとProテキストから音声への変換モデルのプレビュー版をリリースしました。これは今年5月の旧システムを全面的に置き換えます。新しいモデルには感情レベルの表現、文脈に合わせたテンポ調整機能、24言語の多役割会話機能が搭載されており、開発者は無料でテストできます。2025年第1四半期に本番環境に導入される予定です。

image.png

【AiBase要約:】

🧠 感情レベルの表現:「明るく楽観的」から「暗く厳粛」までワンクリックで切り替え可能、音声の表現力を高めます。

🔄 テンポの自動調整:文脈に応じて早さ・遅さを自動調整し、物語をより生き生きとします。

🌐 多役割+24言語:異言語間の一貫性を確保し、役割の混在を防ぎ、自然な会話の移行を実現します。

詳細リンク:https://x.com/GoogleAIStudio/status/1998876411734692107

4. 商湯Seko 2.0リリース:一文で100話を生成、AIアニメ劇制作コストは「一杯の紅茶の値段」

商湯科技が発表したSeko2.0 AIビデオエージェントは、一文のアイデアで100話を連続して生成することができ、非常に低コストで高度な自動化が特徴です。

image.png

【AiBase要約:】

🎬 Seko2.0はユーザーが一文のアイデアを入力することで、100話を連続して生成することができる。

🔄 複数話の記憶+グローバルな一貫性構造を採用し、キャラクターやストーリーの崩壊を防ぐ。

💰 商湯科技は制作コストが一杯の紅茶の価格であると宣伝している。

詳細リンク:https://seko.sensetime.com/explore

5. 2025年度の文字・語句候補発表!DeepSeek と草台班子が選出

漢語カウント2025では、年度の文字・語句候補の上位5つが発表されました。国内と国際の文字・語句を含み、社会の革新と発展傾向、そして国際情勢の変化を反映しています。

image.png

【AiBase要約:】

🧠 2025年の文字・語句候補が発表され、国内・国際の文字・語句の4つのセクターをカバー。

📅 最終結果は12月19日に発表され、人々の期待を高めている。

💬 候補文字・語句は社会現象と時代の流れを反映しており、注目すべき。

6. AdobeとChatGPTが新たな画像とPDF編集機能を共同でリリース

AdobeとChatGPTは、ユーザーがChatGPTを通じてPhotoshop、Acrobat、Adobe Expressなどのアプリケーションを直接編集できる新たな使用方法をリリースしました。ユーザーは対話中に関連するアプリケーション名を入力し、編集が必要なファイルを添付し、簡単な日常言語で必要な要求を説明すれば、画像とPDFのデザインと編集を簡単に完了できます。異なるソフトウェア間での頻繁な切り替えを避けることができます。

image.png

【AiBase要約:】

🖼️ ユーザーは必要を説明するだけで、操作を簡略化し、さまざまな編集オプションを提供。

📑 この統合はPhotoshop、Acrobat、Adobe Expressをサポートし、さまざまなデザイン作業を簡単に行うことが可能です。

🌟 AdobeとChatGPTの協力により、ユーザーは対話で画像とPDFを直接編集することが可能です。

7. 「掲示板」のストレスを卒業!腾讯元宝AIがQQグループのメッセージ要約機能をリリースし、グループチャット体験を再構築

腾讯元宝がリリースしたインテリジェントな未読メッセージ要約機能は、長すぎるグループチャットの記録を要点を明確にした要約レポートにまとめ、ユーザーが情報過多によって生じるストレスや重要な情報を見逃す問題を解決します。この機能は多次元のインテリジェントな整理を提供し、多プラットフォームの配置をサポートし、AI技術の普及を加速します。

image.png

【AiBase要約:】

🤖 インテリジェントな未読メッセージ要約機能により、QQグループチャットの効率が向上。

📊 多次元のインテリジェントな整理を提供し、熱い話題の分類、正確な情報追跡、グループファイルの統合を含む。

🌐 多プラットフォームの配置により、AIの普遍化を加速し、PC版、ブラウザ拡張機能、モバイルアプリをカバー。

8. ChatGPTがアップルストアのダウンロード首位に!米国ユーザーの最も好きなアプリに

ChatGPTは2025年にアメリカ市場でダウンロード数が最高の無料アプリとなり、初めて首位に登頂し、人工知能が米国ユーザーの日常生活において重要な存在であることを示しています。

image.png

【AiBase要約:】

🤖 ChatGPTはアップル米国市場でダウンロード数が最高の無料アプリ

📊 2025年のランキングではChatGPTが初登場で首位に、従来の人気アプリを上回った。

🌐 AIチャットツールの人気は上昇中、OpenAIはグーグルの検索市場に挑戦する可能性がある。