【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目すべきコンテンツをお届けし、開発者に焦点を当て、技術トレンドやイノベーティブなAI製品の応用について理解を深めていただきます。

新鮮なAI製品クリックして詳細を確認https://app.aibase.com/zh

1、騰訊(Tencent)が混元(Hunyuan)オープンソースモデル「HunyuanOCR」をリリース:10億パラメータで複数のSOTAを達成し、OCRアプリケーションを支援

騰訊(Tencent)の混元(Hunyuan)が、新たなOCRモデル「HunyuanOCR」をオープンソースとして公開しました。このモデルは10億パラメータであり、混元のオリジナルマルチモーダルアーキテクチャを基盤としており、業界のOCRアプリケーションランキングでSOTAを達成しています。全エンドツーエンドの設計により、効率的で使いやすく、高性能な特徴を持ち、多言語文書解析、領収書の項目抽出、動画字幕抽出などの用途に広く応用されています。

image.png

【AiBaseの要約:】

🔥 HunyuanOCRは軽量なOCRモデルで、パラメータはわずか10億であり、展開と使用が簡単です。

📊 OmniDocBenchでの評価では、HunyuanOCRはグーグルのGemini3-Proなど優れたモデルを上回る94.1点を記録しました。

🌍 14種類の頻繁に使われる小言語および中国語・英語の相互翻訳をサポートし、ICDAR2025エンドツーエンドドキュメント翻訳コンテストで小規模モデル部門で優勝しました。

詳細リンク:https://hunyuan.tencent.com/vision/zh?tabIndex=0 https://github.com/Tencent-Hunyuan/HunyuanOCR

2、豆包入力法が正式リリース:AIを深く統合し、複雑な文脈のインテリジェント予測とオフライン利用をサポート

豆包入力法が正式リリースされ、AI技術を深く統合し、複雑な文脈のインテリジェント予測とオフライン利用をサポートし、ユーザーにより効率的で使いやすい入力体験を提供します。

image.png

【AiBaseの要約:】

🗣️ 複数の方言、英語、中英混合入力をサポートし、騒音環境にも適応します。

⌨️ AI技術により長文入力の正確性を向上させ、文脈に基づいて自動的に誤りを修正します。

🌐 ユーザーインターフェースはシンプルで広告なし、オフラインでの音声入力もサポートします。

3、AnthropicがClaude Opus4.5をリリース:より高い知能と効率を目指すハイブリッド推論モデル

Anthropicは最新の旗艦モデルであるClaude Opus4.5をリリースしました。このモデルはコード作成、推論、長期的なタスク管理において優れた性能を示し、ソフトウェアエンジニアリング、マルチエージェント協調、オフィスオートメーションなどのシナリオで生産性を大幅に向上させました。同時に、Opus4.5はセキュリティ、効率、リソース使用の柔軟性において大きな改善を遂げています。

image.png

【AiBaseの要約:】

🧠 コード作成、推論、長期的なタスク管理の核心的な能力を持ち、性能は世界をリードしています。

🚀 長い文脈ウィンドウをサポートし、「effortパラメータ」を導入して計算強度と出力品質を向上させます。

🔒 セキュリティが強化され、対応性と耐障害性が以前のバージョンを上回り、誤導されにくくなっています。

4、ChatGPT「ショッピングリサーチ」がリリース:ユーザーの「記憶」を利用して深く推薦、正確率は64%に達する

OpenAIは「ショッピングリサーチ」という新しい機能をリリースし、ChatGPTがユーザーの会話履歴に基づいてパーソナライズされた製品検索と推薦を行うことができるようにしました。この機能はホリデーシーズン中に基本的に制限なく利用でき、専用モデルで動作しており、正確率は64%です。

image.png

【AiBaseの要約:】

🛒 ショッピングリサーチ機能はユーザーの過去の会話を分析してパーソナライズされた推薦を行います。

🔍 このツールは問題を主に提起し、視覚的なショッピングガイドを生成します。

📊 専用モデルの正確率は64%に達し、標準モデルよりもはるかに高いです。

5、世界初の「純AMD」訓練MoE大規模モデルZAYA1がリリース:14Tトークン+CCA注意力、性能はQwen3と同等

記事では、AMDとIBM、AIスタートアップ企業Zyphraが共同でリリースした世界初の完全にAMDハードウェアで訓練されたMoEベースモデルZAYA1について紹介しています。このモデルは予備トレーニングデータ量、性能表現、アーキテクチャの革新において強力な実力を示しており、特に数学やSTEM推論分野で優れた性能を発揮しています。

image.png

【AiBaseの要約:】

🔥 ZAYA1は世界初の完全にAMDハードウェアで訓練されたMoEベースモデルであり、AMDが大規模モデル訓練における潜在能力を示しています。

💡 CCA注意力機構はメモリ使用量を著しく低下させ、長文脈のトランザクション能力を向上させ、アーキテクチャ上の革新を示しています。

📈 ZAYA1はいくつかのベンチマークテストでQwen3シリーズと同等の性能を示し、一部のタスクではQwen3プロフェッショナル版を上回ることもあり、その強力な性能を示しています。

6、マイクロソフトがFara-7Bをリリース:ローカルで動作するコンピューターアシスタント

マイクロソフトがリリースしたFara-7Bは、70億パラメータを持つローカルで動作するコンピューターアシスタントであり、データセキュリティとプライバシー保護に重点を置いています。これはWebページをビジュアル方式で処理し、ユーザーとのインタラクションがより直感的であり、タスク実行効率は他の大規模モデルを上回っています。

image.png

【AiBaseの要約:】

🌟 Fara-7Bはローカルで動作するコンピューターアシスタントであり、データセキュリティとプライバシー保護に重点を置いています。

⚙️ このモデルはWebページをビジュアル方式で処理し、ユーザーとのインタラクションがより直感的で、効率は他の大規模モデルを大きく上回ります。

🛡️ Fara-7Bには「キーポイント」認識機能があり、ユーザーが重要な操作を行う前に確認できるようにし、セキュリティを向上させます。

7、グーグルのNano Bana Proモデル初登場:NotebookLMにスライドと情報グラフィック機能を追加

グーグルはAIノートツール「NotebookLM」にスライドジェネレーター機能を追加し、ユーザーがノートや資料を素早く簡潔なプレゼンスライドに変換できるようにしました。この新しいツールは、グーグルのNano Bana Proモデル(つまりGemini3Pro画像生成)を基盤としており、ユーザーの整理効率と視覚的効果を向上させることが目的です。

image.png

【AiBaseの要約:】

✨ スライドジェネレーター機能を追加し、ユーザーがノートを効率的に整理し、プレゼンスライドの下書きを作成できるようにします。

🖼️ Nano Bana Proモデルを基盤として、詳細な指示を正確かつ大量のテキストを含む画像に変換できます。

📄 現在はPDF形式で出力可能で、今後Google SlidesやPowerPoint形式のサポートを計画しています。

8、Amazon Leoが企業テストを開始:1Gbpsの衛星直結AWS、2025年末に開始、2026年に全面商用化

Amazon Leoのリリースは、アマゾンが低軌道衛星ネットワーク分野で大きな進展を遂げたことを示しています。3種類の端末機器を提供し、高速データ伝送をサポートし、AWSコアネットワークを通じて安全な接続を実現し、「衛星+クラウド+AI」の一体化モデルを強調し、産業レベルおよび遠隔地の通信ニーズに対応することを目的としています。

image.png

【AiBaseの要約:】

🛰️ Amazon Leoは3種類の端末機器を提供し、それぞれ産業レベルのシナリオ、遠隔オフィス、軽量アプリケーションに適しています。

🔒 端末は軍規格設計とAES-256暗号化を備え、極端な環境でも安定して動作し、データセキュリティを確保します。

🌐 各衛星はAWSエッジノードとして機能し、顧客は直接クラウドサービスを呼び出すことができ、差別化競争力となります。