ようこそ【AIニュース】のコーナーへ!ここは毎日人工智能世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて、技術トレンドを理解し、革新的なAI製品の応用を紹介します。

新鮮なAI製品クリックして詳細を確認https://app.aibase.com/zh

1. ドウボーがSeedance 1.5 Proをリリース、音声ビデオを直接生成可能に

バイテューワンの新しい音声・映像創作モデル「Seedance 1.5 Pro」がドウボーに登場し、一般ユーザーに低コストで音声付きビデオを作成する新しい体験を提供しています。このモデルは、文章、画像、音声の創作プロセスを統合的にアップグレードし、より自然な音声合成や映画のようなストーリーテリング、動的なカメラワークを実現し、ユーザーが高品質な音声付きビデオを作成しやすくなりました。

image.png

【AiBaseの要約:】

🎥 意図と音画同期:モデルはテキストの意味を深く理解し、一致する画面とサウンド、台詞を生成できます。

🗣 より自然な「喋る」表現:人物の台詞のトーンやテンポが人間のように自然になります。

🎬 映画風のストーリーテリング+動的なカメラワーク:画面にはズームイン・ズームアウト、カメラの動きが含まれており、複雑なアクションも正確に捉えます。

2. GPT-5.2-Codexが正式リリース:「文脈圧縮」により長距離コード作業を克服

GPT-5.2-Codexのリリースは、知能コード作成分野での大きな進歩を示しており、コード再構築、システム移行、サイバーセキュリティ防御において優れた性能を発揮し、厳格なアクセス制御戦略によって技術の安全性を確保しています。

image.png

【AiBaseの要約:】

🧠 GPT-5.2-Codexは文脈圧縮技術を通じて長期タスク処理能力を向上させています。

🛡️ サイバーセキュリティ分野ではプロ級のCTF(奪旗コンテスト)実戦レベルを示しています。

🔒 複数層の展開戦略を採用し、技術の広範な利用と安全規制の両立を確保しています。

3. メイティアンがSOTA級の仮想人物ビデオ生成モデルLongCat-Video-Avatarをリリース

メイティアンのLongCatチームがSOTA級の仮想人物ビデオ生成モデルLongCat-Video-Avatarをリリースしました。このモデルは長時間のビデオ生成において優れた性能を持ち、多くの核心機能を備えており、広範な開発者の注目を集めています。

image.png

【AiBaseの要約:】

🎥 LongCat-Video-AvatarはメイティアンのLongCatチームが開発したビデオ生成モデルで、多様なタスク機能をサポートしています。

🧠 コロッケ・チャンク・ラテン・スタッチング訓練戦略を採用し、長時間のビデオ生成品質を向上させています。

📊 複数のデータセットでSOTAレベルに達しており、強力な応用可能性を示しています。

詳細リンク:https://github.com/meituan-longcat/LongCat-Video

4. アップルが新たなマルチモーダルAIモデルUniGen 1.5をリリース、画像理解・生成・編集の統合を実現

アップルが最新のマルチモーダルAIモデルUniGen 1.5をリリースし、画像処理分野で重要な進歩を遂げました。このモデルは画像理解、生成、編集の機能を統合し、効率を大幅に向上させました。「編集コマンドの整合性」技術を導入することで、ユーザーの意図をより正確に捉え、画像編集の精度を向上させました。多数の業界標準テストで優れたパフォーマンスを発揮し、強い競争力を示しています。

image.png

【AiBaseの要約:】

🧠 UniGen 1.5は画像理解、生成、編集の機能を統合し、効率を向上させています。

🛠️ 「編集コマンドの整合性」技術を導入し、画像編集の精度を向上させています。

📊 多くのテストで優れた結果を示し、強力な競争力を示しています。

詳細リンク:https://arxiv.org/abs/2511.14760

5. ElevenLabsがWhatsAppと連携!AI音声アシスタントが電話を受けたり、大量発信が可能に、カスタマーサービスの革命が始まる

ElevenLabsは2025年12月18日に、AI音声エージェント(Agents)をWhatsAppに深く統合し、テキストと音声の両方で完全な通路の対話が可能になりました。この更新により、企業のカスタマーサービス効率が向上し、導入コストが低下し、顧客満足度と転換効率が著しく向上しました。

image.png

【AiBaseの要約:】

✅ 自然に電話を受ける:ユーザーが企業のWhatsApp番号に電話をかけたとき、AIが非常に人間らしい音声で応答します。

✅ 主動的な発信サービス:単一または大量の発信が可能で、予約のリマインダー、支払いの催促、顧客への回訪などの頻繁なシナリオに適しています。

✅ 実時間の音声インタラクティブ:ユーザーが音声メッセージを送るか、AIが電話をかけてくる場合でも、低遅延かつ自然な流れの会話を実現します。

詳細リンク:https://elevenlabs.io/docs/agents-platform/whatsapp

6. バイテューワンのAIスマートフォン提携案が明らかに、トークンの収益分配なしで「利益を減らして入口を獲得」

バイテューワンは複数の主要なハードウェアメーカーとAIスマートフォンの提携を積極的に進めています。AIGCプラグインを事前に搭載することでAI流量の入口を得ており、メーカーを引き付けるために利益配分なしの戦略を提供し、自身のAI分野における競争力を強化しています。

image.png

【AiBaseの要約:】

📱 バイテューワンはvivo、联想、伝音などのメーカーと提携し、AIGCプラグインを事前に搭載してAI流量の入口を得ています。

💰 メーカーのカスタム開発費用とトークン販売収益配分を免除する戦略を採用し、スマートフォンメーカーに流量配分と収益配分を呼び込んでいます。

🤝 この提携はスマートフォンメーカーが第三者のAIに対して持つ警戒心を打破し、AIの競争力を高めるものです。

7. Claude AIに新「タスクモード」が登場:スマートアシスタントが進化し、質問ができるだけでなく、実行もできるようになった

Claude AIの新タスクモードは、独創的な二画面レイアウト、構造化された行動計画、自動化スキルの統合を通じて、複雑なタスクにおけるスマートアシスタントの性能とユーザー体験を顕著に向上させました。

image.png

【AiBaseの要約:】

🧠 タスクモードは二画面レイアウトを導入し、タスクの実行効率を向上させています。

📝 構造化された行動計画と明確化の質問をサポートし、タスクの正確性を確保しています。

🛠️ 複数のスキルとモデルの文脈プロトコルを統合し、自動化されたタスク処理を実現しています。

8. LumaがRay3 Modifyをリリース:AIビデオ編集の新突破、俳優の演技の細部を保持し、ワンクリックで衣装やシーンの変更が可能

Luma AIがRay3 Modifyをリリースし、実写ビデオの高精度なAI修正を実現し、俳優の演技の細部を保持しつつ、服の交換やシーンの変更が可能です。これは映画、広告、ゲームなどの業界に新たな創造の可能性をもたらします。

image.png

【AiBaseの要約:】

🎬 角色参照画像とキーフレームを使用して正確な編集を実現します。

🔄 俳優の演技の細部を保持し、衣装やシーンの変更が可能です。

💰 9億ドルの資金調達を行い、AI計算クラスターの建設を計画しています。

9. QQ MusicがローカルAI作曲をリリース:クールユーラーUltra搭載、数分で完成した曲を生成、創作のプライバシーを漏洩しない

QQ MusicがリリースしたローカルAI作曲機能は、クールユーラーUltraプロセッサーにより完全なローカル化の大規模モデル音楽生成を実現し、創作の門檻を大幅に下げるとともに、プライバシーの安全性を確保しています。

image.png

【AiBaseの要約:】

🎧 QQ MusicはローカルAI作曲機能をリリースし、ユーザーはインターネット接続なしでオリジナルの曲を作成できます。

🔒 ローカルの推論経路を採用し、創作のプライバシーを保護し、データはサーバーにアップロードされません。

🧠 クールユーラーUltraプロセッサーはNPUを内蔵しており、AI計算効率を向上させ、バッテリー寿命を延ばします。

10. WeChat元宝AIアシスタントに新機能追加、簡単な一言でリマインダーを設定

WeChat元宝AIアシスタントは、一言でリマインダーを設定する機能を追加し、ユーザーが日程やタスクをより簡単に管理できるようにしました。また、公式アカウントの記事、画像、ドキュメントの解析機能があり、音声インタラクティブをサポートし、使用の障壁を下げ、さまざまなユーザー層に適しています。

image.png

【AiBaseの要約:】

📅 元宝AIアシスタントはユーザーが一言でリマインダーを設定でき、日程管理の利便性を向上させています。

🗣️ ユーザーは音声メッセージを使って元宝とやり取りができ、高齢者ユーザーにとって使いやすいです。

📱 元宝はリマインダー機能に限らず、記事の解析、画像と文章の認識など、多くの実用的な機能を提供しています。