【AIデイリーレポート】へようこそ!ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳しく見るhttps://app.aibase.com/zh

1、世界初の「主体参照」機能:可靈AI3.0が正式リリース、15秒の長動画でAIディレクター時代を開く

可靈AI 3.0のリリースは、AI動画制作が新たな時代に入ったことを示しています。マルチモーダル入出力の一元化により、AI動画の制作ワークフローを再定義し、誰もがディレクターになれるようになりました。

image.png

【AiBaseの要点:】

🎥 世界初の「主体参照」機能を搭載し、主人公や小物、シーンの特徴を正確に特定。

🎬 スマートなカットと超長時間の生成により、映画のようなストーリー展開が可能。

🖼️ 複数言語および方言に対応し、口元、表情、声質を完璧に同期。

2、アリババAI戦略の更なるアップグレード:大規模モデルブランドが正式に「千問(Qwen)」に改称

アリババグループは、自社のAI技術全体および主要ブランドを統一的に「千問(Qwen)」として改称しました。これにより、複数ブランドによる市場認識の混乱を解消し、アリババがAI分野でのブランド伝播をより集中化した段階に進みました。また、SpaceXは百万機の衛星システムの設置申請を行ったことで業界から注目されています。

image.png

【AiBaseの要点:】

🧠 千問大規模モデルブランドが「千問(Qwen)」に統一され、市場認知の一貫性が向上。

🌐 全球的に英語名「Qwen」を使用し、国際的なブランドイメージを強化。

🛰️ SpaceXが百万機の衛星システム設置申請を提出し、広範な注目を集めました。

3、遅延が0.2秒未満!Mistral AIがVoxtral Transcribe 2音声モデルをリリース、中国語リアルタイム変換対応

Mistral AIがリリースしたVoxtral Transcribe 2音声文字変換モデルシリーズは、さまざまなアプリケーションシナリオに最適化されており、音声インタラクションにおける高遅延やコストの課題を解決しています。Voxtral Realtimeは極めて低遅延を実現し、Voxtral Miniは高いコストパフォーマンスと長時間の音声処理能力が特徴です。両モデルとも中国語を含む13言語をサポートしており、競争力のある価格戦略を採用し、多様な音声インタラクションシナリオに適しています。

image.png

【AiBaseの要点:】

⚡ 極めて低い遅延:Voxtral Realtimeモデルは変換遅延を200ms以下に抑えることができ、音声の即時変換が可能で、モデルの重みもオープンソース化されています。

🏆 高コストパフォーマンス:Voxtral Mini版はGPT-4o miniなどと比較して精度が優れ、3時間以上の長音声処理が可能で、価格が非常に有利です。

🌐 多言語対応:全シリーズモデルは中国語を含む13言語をネイティブにサポートしており、グローバルな音声業務やリアルタイムインタラクションシナリオに幅広く適応しています。

4、上海AI研究所が科学マルチモーダルモデル「書生Intern-S1-Pro」を公開

上海AI研究所は、世界最大規模のオープンソースパラメータを持つ科学マルチモーダルモデル「書生Intern-S1-Pro」をリリースしました。このモデルはSAGEテクノロジー構造に基づき、1兆のパラメータを持ち、特に論理的推論や研究用AIエージェントにおいて世界的な先進性を備えています。

image.png

【AiBaseの要点:】

✨ 書生Intern-S1-Proは世界最大規模のオープンソースパラメータを持つ科学マルチモーダルモデルで、1兆のパラメータを持っています。

🧠 高難度の総合学問評価で優れた性能を発揮し、論理的推論能力はオリンピック金メダリストレベルです。

🚀 ハイブリッドエキスパート構造(MoE)を採用し、計算効率を最適化し、リソース消費を削減し、超大規模モデルの訓練に基盤を築きます。

5、Geminiユーザー数が7.5億人突破:グーグル財務報告が好調、ChatGPTに追従

グーグル親会社アルファベットは、2025年第4四半期の財務報告を発表し、その中でAI事業の成果が目立ちます。Geminiの月間アクティブユーザー数は7.5億人に達し、驚異的な成長傾向を示しています。同時に、グーグルは低価格サブスクリプションプラン「Google AI Plus」をリリースし、自社開発チップ「Ironwood」を導入することで、年間売上高が初めて4000億ドルを突破し、会社全体が「AI第一」という企業体へと全面的な転換を果たしました。

image.png

【AiBaseの要点:】

📈 Geminiのユーザー数が7.5億人に達し、強い成長トレンドを示しています。

💰 グーグルは低価格サブスクリプションプラン「Google AI Plus」を提供し、価格敏感層を引きつけています。

🚀 自社開発チップ「Ironwood」とGemini 3によって、アルファベットの年間売上高が4000億ドルを突破しました。

6、画面摩爾紋をAIで除去!华为Mate 80シリーズにHarmonyOS新版ファームウェアを配信開始

華為Mate 80シリーズは、HarmonyOS 6.0.0.130SP17システム更新を配信し、AIで画面摩爾紋を除去する機能を導入し、画像処理能力を向上させ、スターフラッシュと定位性能を最適化しました。

image.png

【AiBaseの要点:】

✨ AI写真編集機能の導入:画面摩爾紋を正確に除去し、写真の明確さを向上。

📶 スターフラッシュ音声接続の安定性を向上し、Bluetoothの使用体験を改善。

🧭 定位精度を向上させ、移動ネットワーク接続性能を最適化。

7、オリンピック史上初!ミラノ冬季オリンピックがアリババの「千問(Qwen)」公式大規模モデルを採用

記事では、2026年のミラノ冬季オリンピックがアリババの「千問(Qwen)」公式大規模モデルを採用し、オリンピックの技術がスマートな時代へと進化していること、およびBilibiliと春晚との協力がAIのトップIPでの広範な応用を示していることが紹介されています。

image.png

【AiBaseの要点:】

🧠 オリンピック史上初の公式大規模モデルが登場し、スマートオリンピックの始まりを告げました。

📺 Bilibiliと春晚との協力により、コメントのインタラクティブ体験が向上しました。

🚀 AIは世界中のトップIPのビジネスロジックとユーザー体験を深く変革しています。

8、中国の生成型AI利用者が6億人に到達:普及率が40%を超え、計算力水準が世界でも上位に

中国の生成型人工知能利用者が急速に増加し、普及率が顕著に向上しました。一方で、計算力インフラも飛躍的な進歩を遂げ、AI技術の広範な応用を支えています。

image.png

【AiBaseの要点:】

📈 中国の生成型AI利用者は6.02億人に達し、2024年末と比べて141.7%の増加を記録し、普及率は42.8%に達しました。

💻 全国で42の万カーチップクラスターが建設され、スマート計算力の総規模は1590 EFLOPSを超えており、世界でも上位に位置しています。

🚀 生成型AIは日常生活と生産活動に急速に浸透し、デジタルトランスフォーメーションと経済の高品質発展の重要なエンジンとなっています。