【AI日報】へようこそ!ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野のホットな情報を提供し、開発者に焦点を当てて、技術トレンドを把握し、革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳細を見るhttps://app.aibase.com/zh

1、百度(バイドゥ)文心 ERNIE-5.0-0110 が正式リリース、数学能力は世界第2位

百度が最新にリリースした文心大モデル「ERNIE-5.0-0110」は、複数の権威ある評価で優れた性能を示し、特に数学処理能力では世界第2位となっています。このモデルはプログラミング開発、専門知識の蓄積、クリエイティブな執筆においても顕著な強化が行われており、複雑な指示をより正確に実行できるようになっています。

image.png

【AiBase要約:】

🧠 ERNIE-5.0-0110 は数学処理能力で世界第2位を獲得し、GPT-5.2-Highに次ぐ性能を示しています。

💻 プログラミング開発、専門知識の蓄積およびクリエイティブな執筆において顕著な改善がされています。

🏥 科学研究、商業金融、医療健康など多くの職業分野で高い専門性を示しています。

詳細リンク:https://ernie.baidu.com/

2、ステップスターリーの音声モデル Step-Audio-R1.1 が世界第1位に登場

ステップスターリー社が公開したオープンソースの音声推論モデル「Step-Audio-R1.1」は、世界中の人工知能モデル評価で見事第1位を獲得しました。これは、音声処理や論理的推論における優れた能力を証明しています。このモデルには深い音声推論能力和リアルタイム応答機能があり、音声コンテンツをエンド・トゥ・エンドで理解でき、ストリーミング推論にも対応しています。ユーザーはHuggingFaceから無料でモデルをダウンロードし、オープンプラットフォームで試すことができます。

image.png

【AiBase要約:】

🌟 国際評価で96.4%の正確率で世界第1位を獲得しました!

📈 深い音声推論とリアルタイム応答機能を持ち、ストリーミング推論に対応しています。

💻 HuggingFaceから無料でモデルをダウンロードし、オープンプラットフォームで試すことができます。

詳細リンク:https://huggingface.co/stepfun-ai/Step-Audio-R1.1

3、Qwenはアリババエコシステムに全面的に統合:オンライン注文、航空券購入は一言で完了し、「AI業務」時代を開く

Qwenアプリはアリババの核心的なエコシステムビジネスに全面的に統合され、オンライン注文、買い物、航空券予約などのAI業務機能を実現しました。今回のアップデートでは400以上のAI業務機能がリリースされ、すべてのユーザーにテストを開放しました。Qwenは技術的突破により、リアルタイムツール構築、全モード理解能力、超長文脈処理能力を向上させ、AIが画面を理解し複雑な多段階計画を実行できるようにしました。現在、Qwenは民生と出張シーンに深く浸透しており、ビザ、住宅資金など50項目の行政サービスに統合され、飛猪と高徳を活用して行程計画やレストラン予約の電話を代行することも可能です。

image.png

【AiBase要約:】

✅ Qwenアプリはアリババの核心的なエコシステムビジネスに統合され、AI業務機能を実現しています。

🚀 400以上のAI業務機能がリリースされ、ユーザーは直接テストできます。

🌐 民生と出張シーンに深く浸透し、行政サービスに統合され、多段階計画に対応しています。

4、ロボットでも「短期労働」ができる:プラットフォーム「Qingtian ZHU」が資金調達を完了し、ユーザー数が20万を突破

身軸知能のリーディング企業が共同で設立したロボットレンタルプラットフォーム「Qingtian ZHU」は、ロボット産業におけるコストが高い問題と場面が散在している問題を解決する革新的なビジネスモデルを採用しています。このプラットフォームはシードラウンドの資金調達を完了し、全国的なサービスネットワークの拡大を目指しています。

image.png

【AiBase要約:】

🤖 Qingtian ZHUは「シェアリングレンタル+プラットフォームでのスケジューリング」モデルを採用し、ロボットの利用の障壁を低下させます。

📈 現時点で、Qingtian ZHUの登録ユーザーは20万人を超えています。日平均注文数は200件以上安定しています。

🚀 Qingtian ZHUは2026年までに10社以上の本体メーカーと提携し、200社のサービスパートナーを育成し、全国200都市にカバーする予定です。

5、動画圧縮率0.02%:中国電信が生成型動画圧縮技術GVCを発表

中国電信人工知能研究院(TeleAI)は、画期的な生成型動画圧縮技術GVC(Generative Video Compression)を発表しました。この技術は動画データの圧縮率を0.02%にまで引き上げました。この技術の核となる考え方は「計算で帯域幅を交換する」ことで、画像の完全なピクセルではなく「どのように画像を描くか」という指示を送ることで、極限的な圧縮を実現しています。GVCは公式データセットでのテスト結果が従来アルゴリズムを大幅に上回り、同等の視覚品質で従来方法がGVCの6倍以上の帯域幅を消費しています。現在、このモデルは消費者向けGPUでほぼリアルタイムの生成速度を実現しており、今後は極端なネットワーク環境下での高精細動画伝送に貢献する可能性があります。

image.png

【AiBase要約:】

🧠 ロジックの変更:従来のピクセル転送のパターンを変えて、高次元の意味トークンを送信し、生成型AIを使って受信側で動画を再描写します。

📉 高度な圧縮:技術は動画の圧縮率を0.02%まで下げ、1GBの動画が200KBのデータ量で受信側で再生可能になります。

⚓ 広範囲な用途:極めて低い帯域幅環境向けに設計されており、衛星通信、遠洋航海、災害現場の救助など極端な信号状況での応用が可能です。

詳細リンク:https://www.arxiv.org/abs/2512.24300

6、国内トップブランドがAI物理ボタンに注目?荣耀Magic8が先行、五大メーカーが激戦に

記事では、国内スマホメーカーがAI物理ボタンに関心を寄せていることと、その可能性のある操作方法の変革について考察しています。

image.png

【AiBase要約:】

📱 AI物理ボタンが国内スマートフォンメーカーの注目を集め、人間とスマートデバイスとの関係を再定義するかもしれません。

🔄 荣耀Magic8シリーズは専用の物理ボタンを導入し、二回押すことでカメラを素早く起動し、自社のYOYOインテリジェントエージェントと深く統合しています。

🌐 AI物理ボタンは単なるスイッチではなく、ハードウェア、システム、そして複数のデバイスとの協調をつなぐ「ニューロンの突起」です。

7、字節跳動がハードウェア展開を加速:豆包AIイヤホンは歌爾が製造、AIメガネは10万台の量産、スマホアシスタントのサンプル機は完売

字節跳動は豆包AIハードウェアエコシステムの構築を加速しており、イヤホンからメガネ、スマホアシスタントに至るまで、全シーンのAIエントリーポイントを構築するという戦略意図を示しています。

image.png

【AiBase要約:】

📱 豆包AIイヤホンは歌爾股份によって製造され、字節跳動が製品の完成度を重視していることを示しています。

👓 第1世代のAIメガネは10万台の量産を計画し、高通AR1専用チップを採用し、高性能AI演算能力の必要性を示しています。

📲 豆包スマホアシスタントの技術プレビュー版は努比亚M153のエンジニアリングサンプルに統合され、完売していることから、開発者がエッジ側のAI能力へのニーズが強いことがわかります。

8、Google翻訳と直接対決:OpenAIが独自の翻訳ウェブサイトを秘密裡にリリース、画像とドキュメントをサポート

OpenAIはChatGPT Translateをリリースし、機能が強く、インタラクティブ性が高く、Google翻訳を直接対象としています。このツールはマルチモーダル入力、意訳優先、対話形式の微調整をサポートしており、OpenAIが消費者製品分野での戦略転換を示しています。

image.png

【AiBase要約:】

🖼️ テキスト、音声、ファイル、画像などのマルチモーダル入力をサポートしています。

📝 意訳優先で、原文の深い意味を保持し、トーン調整もサポートしています。

💬 対話形式の微調整で、ユーザーは翻訳内容に対して質問や修正を行えます。