【AIニュース】へようこそ!ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野の注目すべきトピックをお届けし、開発者に焦点を当て、技術のトレンドを理解し、革新的なAI製品の応用を紹介します。
新規のAI製品詳しく見る:https://app.aibase.com/zh
1. カクシャン(Kuaishou)のKeling 2.6が全面リリース!「音と映像の同時生成」、画面、自然な声、サウンド効果、環境雰囲気
カクシャンの子会社であるKeling AIは、初めての「音と映像の同時生成」モデルであるKeling 2.6をリリースしました。このモデルは、一度の生成プロセスで画像、自然な音声、サウンド効果、そして環境の雰囲気を同時に生成することができます。ユーザーの創造体験を向上させます。このモデルには「テキストから音と映像を生成する」および「画像から音と映像を生成する」2つの創作ルートが提供されており、単人スピーチ、ナレーション、多人数の対話や音楽パフォーマンスなどのさまざまなコンテンツ形式に対応しています。

【AiBase要約:】
🎨 Keling 2.6モデルは音と映像の同期生成を実現し、ユーザーの創造体験を向上させます。
🖋️ 「テキストから音と映像を生成する」と「画像から音と映像を生成する」2つの創作ルートを提供し、多様なコンテンツ形式に適応します。
🎤 多くのシナリオ、例えば独白、ナレーション、会話、音楽パフォーマンスなどに広く適用可能です。
2. ツイッターが大規模なアップデート!Seedream 4.5公開、画像生成は「複数画像の一貫性」時代へ
ツイッターの子会社であるSeedチームがSeedream 4.5をリリースしました。このモデルは、複数画像の場面の一貫性と芸術的指示の遵守を強調しており、画像生成における課題を解決し、画像生成の質と実用性を向上させました。

【AiBase要約:】
🧠 複数画像の場面の一貫性が向上し、キャラクター、衣装、照明、構図が非常に統一されています。
🎨 美学指令の遵守が大幅に向上し、スタイルのキーワードを正確に捉えています。
⚙️ FluxやMidjourney v6.1と直接対決し、細部にこだわるユーザーにとって嬉しい情報です。
3. ドウポー(Doubao)モバイルアシスタントが微信操作機能を緊急停止:アカウントの差し止めと「高危険権限」に関する議論への対応
ドウポーのモバイルアシスタントは、ユーザーからの微信使用異常や高危険権限に関する懸念に対して声明を発表し、問題を認めた上で権限取得の状況を説明し、微信操作機能を停止し、ユーザーのプライバシー保護を約束しました。
【AiBase要約:】
📱 ドウポーのモバイルアシスタントは特定の問題を認めてユーザーのフィードバックに応えました。
🔒 ユーザーの許可とプライバシー保護へのコミットメントを強調しました。
🚫 微信操作機能を停止し、徐々に差し止めされたアカウントを解除する予定です。
4. 智源研究院が世界最強のマルチモーダル世界モデルEmu3.5を発表、リアルな世界の「次の瞬間」を一括して予測!
北京智源人工智能研究院がリリースしたEmu3.5マルチモーダル大規模モデルは、画像、テキスト、ビデオをトークンシーケンスとして統合的に符号化することで、リアルな世界の深い理解を実現しました。その中心的な突破点は、「世界の次の瞬間」を予測することです。これは、「ピクセルの移動者」から「世界シミュレータ」への進化であり、マルチモーダル大規模モデルが「生成時代」から「世界モデル時代」へと進むことを示しています。

【AiBase要約:】
🧠 Emu3.5は、画像、テキスト、ビデオをトークンシーケンスとして統合的に符号化し、マルチモーダルの因果関係と物理的常識の学習を実現しています。
🔄 モデルは「世界の次の瞬間」の状態を予測することに専門化しており、「ピクセルの移動者」から「世界シミュレータ」へと進化しています。
🚀 このモデルは、マルチモーダル大規模モデルが「生成時代」から「世界モデル時代」へと進む象徴であり、広範な応用可能性を持っています。
詳細リンク:https://zh.emu.world/pages/web/landingPage
5. AIモデルがスマートコントラクトの脆弱性を発見し、シミュレーション攻撃による損失は460万ドルに達する
MATSとAnthropicによる新しい研究では、先進的なAIモデルがスマートコントラクトのセキュリティ分野において二面的な役割を果たしていることが明らかになりました。これらのモデルは、脆弱性を発見・利用するだけでなく、より強力な防御ツールの開発にも貢献しています。

【AiBase要約:】
🔍 先進的なAIモデルであるClaude Opus4.5やGPT-5は、スマートコントラクトの脆弱性を認識し、利用できることが判明しました。
💸 シミュレーション攻撃による損失は460万ドルに達し、AIモデルは実験中に新たなセキュリティ脆弱性を発見しました。
🔒 AIは潜在的なリスク源であるだけでなく、サイバーセキュリティの強化にも役立ちます。
6. 小米のAIロードマップが初公開:盧偉冰が「AI + 物理世界」に注力、千万元の年収で羅福莉がMiMo大規模モデルを率いる
小米グループの副社長である盧偉冰は、ライブ配信の中でグループのAI戦略方向性を初めて明らかにし、大規模モデルと物理的なシナリオを深く融合させることを強調しました。目標は、AI能力をハードウェアとサービスに埋め込むことでした。羅福莉は正式にMiMo大規模モデルチームに参加し、小米のAI人材戦略の重要な一歩となりました。小米は2025年にパラメータ規模が千億を超えるマルチモーダルモデルをリリースし、スマートフォン、自動車、スマートホームの3つのシーンに展開する予定です。
【AiBase要約:】
🧠 小米グループの副社長である盧偉冰は、ライブ配信でAI戦略方向性を初めて明らかにし、大規模モデルと物理的なシナリオを深く融合させることを強調しました。
💼 羅福莉はMiMo大規模モデルチームに参加し、小米のAI人材戦略の重要な一歩となりました。
🚀 小米は2025年にパラメータ規模が千億を超えるマルチモーダルモデルをリリースし、スマートフォン、自動車、スマートホームの3つのシーンに展開する予定です。
7. グーグルがWorkspace Studioをリリース:AIエージェント構築ツールが完全リリース
グーグルは、ワークスペーススタジオをリリースしました。これは、コードなしでAIエージェントを構築できるツールであり、企業の従業員が迅速に自動化プロセスを作成し、作業効率を向上させることができます。

【AiBase要約:】
🤖 コードなしでAIエージェントを作成し、自動タスク処理を実現できます。
🌐 多くのアプリケーションとの協働とサードパーティとの統合をサポートし、情報の孤立を解消します。
🧠 Gemini3に基づいたインテリジェントな意思決定能力により、企業の効率を向上させます。
8. DeepSeekが2つの主要な新モデルを連続リリース:公式版V3.2とSpecialeが同時にリリース
DeepSeekは2つの主要な新モデルを同時にリリースし、オープンソースの大規模モデル分野での強力な実力と革新性を示しています。
【AiBase要約:】
🧠 DeepSeek-V3.2は、最初に「思考過程」と「ツール呼び出し」を深く統合し、2つのモードを並行してサポートします。
🧠 Specialeバージョンは、「思考を最大限まで開く」強化版であり、推論能力を物理的な極限にまで押し上げています。
🚀 全プラットフォームで秒単位の更新が可能で、ユーザーに気づかれることなくスムーズに切り替えることができます。
