【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術のトレンドや革新的なAI製品・応用について理解を深めていただきます。

新鮮なAI製品クリックして詳細を見るhttps://top.aibase.com/

1. 腾讯混元がオープンソースで0.5B、1.8B、4B、7Bモデルをリリース

腾讯混元チームは、消費向けGPUや低電力環境に適した4種類の小規模オープンソースモデルをリリースしました。これらは垂直領域での低コストのファインチューニングをサポートしており、推論速度、コストパフォーマンス、長文処理能力において優れた性能を発揮しています。また、複数のオープンソースプラットフォームで利用可能です。

image.png

【AiBase要約:】

✨ 消費向けデバイスに特化した4種類の小規模モデル。

🚀 推論が高速で、長文を一度に処理できる。

🔧 エッジからクラウドまでの多様なニーズに対応。

詳細リンク:https://hunyuan.tencent.com/modelSquare/home/list

2. 昆仑万维が最新の推論大規模モデルMindLinkをリリースおよびオープンソース化

昆仑万维は、最新の推論大規模モデルSkywork MindLinkをリリースおよびオープンソース化しました。このモデルは、革新的な推論フレームワークにより動的パス選択を実現し、回答の透明性と効率を向上させ、多くの評価で優れた成績を収めています。

image.png

【AiBase要約:】

🧠 Skywork MindLinkは、Plan-based Reasoningという新しいアプローチを採用し、マルチホップ会話体験を最適化しています。

🏆 多くのベンチマークテストで優れた結果を収め、数学コンテストで金メダルを獲得。

🔧 内蔵された自己適応推論システムにより、タスクの難易度に応じて生成戦略を自動調整。

詳細リンク:https://github.com/SkyworkAI/MindLink

3. B站がAIオリジナル音声翻訳機能をリリース:UP主の声質を保持し、二次元文化の海外展開問題を解決

B站は独自開発したAIオリジナル音声翻訳機能をリリースしました。これは国際版と国内版の統合後のコンテンツ連携問題を解決するためのものです。この技術はUP主の元の声質や音色、話し方を保持し、海外ユーザーに自然な中国語コンテンツ体験を提供します。

image.png

【AiBase要約:】

✅ B站がAIオリジナル音声翻訳機能をリリースし、英語翻訳をサポートし、UP主の元の声質と音色を保持。

🔄 対抗的強化学習とDeep Research技術を使用し、正確な翻訳と文化的なニュアンスを保持。

🌐 今後は日本語など他の言語への拡張も予定され、B站のグローバル展開戦略を支援。

4. グーグルGemini 2.5 Deep Thinkが発表!IMO金メダル付き、AI新王者は未来を変えるか?

グーグルDeepMindがリリースしたGemini 2.5 Deep Thinkモデルは、さまざまな分野で優れた推論能力を示しており、特に2025年の国際数学オリンピックで金メダルを獲得しました。このモデルでは並列思考と強化学習技術を導入し、複雑なタスクの処理能力を向上させ、プログラミングや跨領域知識テストでも優れた成果を収めています。

image.png

【AiBase要約:】

🧠 並列思考機構を導入し、複雑な問題解決能力を向上。

🏆 IMO競技で金メダルを獲得し、最高レベルの数学推論力を示す。

🚀 マルチモーダルと長い文脈に対応し、様々なシナリオに適用可能。

5. OpenAI CEOがGPT-5の新機能を紹介:ネットワーク情報を効率的に統合

OpenAIのCEOサム・オルトマン氏はSNS上でGPT-5のチャット記録のスクリーンショットを共有し、その強力な情報統合能力を紹介しました。GPT-5はSFアニメ「Pantheon」に対してポジティブな評価を示し、この作品がRotten Tomatoesで100%の評価を獲得していることを述べました。この出来事はGPT-5の初公開であり、テクノロジー業界に大きな関心を呼び起こしました。

image.png

【AiBase要約:】

🌟 GPT-5が初めて公開され、強力な情報統合能力を示す。

📺 OpenAI CEOがSFアニメ「Pantheon」を推薦し、モデルのポジティブな評価を共有。

🔍 Rotten Tomatoesで「100% クリティック評価」という評価があり、広範な関心を引いた。

6. アップルがAI回答エンジンチームを設立:ChatGPTに挑戦し、SiriやSafariの検索体験を再構築する可能性

アップル社は、ChatGPTのようなAIアプリケーションを開発するための専門チームを設立しました。このチームは、コア製品の検索およびインタラクション体験を向上させることが目的です。このチームの名前はAnswers, Knowledge, and Informationで、全ネットワーク情報を活用してユーザーの質問に答える答えエンジンの構築に注力しています。

image.png

【AiBase要約:】

🍎 アップルが新しいチームを立ち上げ、ChatGPTのようなAIアプリケーションを開発し、検索とインタラクション体験を向上。

🔍 答えエンジンは独立アプリとしてまたはSiriやSafariなどの製品に統合される可能性あり。

🌐 アップルは第三者的なAIサービスへの依存を減らし、グーグルの反トラスト訴訟の影響に対応。

7. 高德地図が全面的なAI化を宣言し、世界初のAIネイティブマップアプリ「高德地図2025」をリリース

高徳地図は、世界初のAIネイティブマップアプリ「高徳地図2025」を正式にリリースしました。これは、技術分野における重要な飛躍を示しています。このアプリは空間スマート技術を組み合わせ、マルチモーダル情報感知によって地図の知能化を向上させ、多くの分野にポジティブな影響を与える予定です。

image.png

【AiBase要約:】

🚀 高徳地図が世界初のAIネイティブマップアプリをリリースし、技術的な突破。

🧠 空間スマート技術により、マルチモーダル情報感知能力が向上。

🚗 応用はスマートカー、スマートグラス等多个分野に拡大し、移動効率を向上。

8. Adobe Photoshopが「Harmonize」をリリース:AIで光と影を自動調整し、画像合成を無縫接にする

Adobeは、「Harmonize」などの一連の生成型AIツールを通じて、複雑な画像編集プロセスを簡略化し、画像合成と修正の効率を向上させ、画像の真実性を保証するコンテンツ証明を導入しました。

image.png

【AiBase要約:】

🖼️ 「Harmonize」ツールは、画像要素の照明、色、陰影を自動調整し、無縫接な合成を実現。

🔍 AI駆動の画像アップグレード機能により、解像度を最大800万ピクセルまで引き上げながら画質を損なわない。

🔒 コンテンツ証明機能により、画像編集履歴の信頼可能な追跡チェーンを提供し、デジタルコンテンツの真実性を確保。

9. NVIDIAがCosmos DiffusionRendererを発表:画期的なビデオレンダリング技術

NVIDIAは、高品質な画像およびビデオの再光源および除光源処理に使用される新しいビデオ拡散フレームワークであるCosmos DiffusionRendererをリリースしました。この技術は、従来のDiffusionRendererの大幅なアップグレードであり、改善されたデータ計画プロセスによりレンダリング品質を向上させています。

image.png

【AiBase要約:】

🌟 この技術はNVIDIAの従来のDiffusionRendererの大幅なアップグレードであり、より高品質な画像およびビデオレンダリングを提供。

💻 Python3.10をインストールし、少なくとも16GBのNVIDIA GPUを搭載し、関連するconda環境を作成する必要があります。

🎥 画像およびビデオの除光源および再光源処理が可能で、さまざまな環境照度マップを使用してレンダリングできます。

詳細リンク:https://github.com/nv-tlabs/cosmos1-diffusion-renderer

10. Android開発革命!GoogleがAndroid Studioの無料Agentモードをリリースし、Appleエコシステムを打ち負かすか?

GoogleはGoogle I/O2025でAndroid Studioの無料Agentモードを発表しました。このモードはGemini2.5Proに基づいており、自然言語インタラクションを通じて開発効率を向上させ、ファイル間のタスク処理、UIコードの修正、カスタムルールのサポートを可能にします。この機能はAppleのXcodeエコシステムを挑戦し、開発者にさらに効率的なツールを提供しています。

image.png

【AiBase要約:】

🤖 Agentモード:Gemini2.5Proに基づき、自然言語インタラクションで複雑な開発タスクを完了。

🔍 主要機能:UIコードの迅速な修正、カスタムルール設定、百万トークンの文脈窓。

🚀 競争優位性:無料でAgentモードを公開し、AppleのXcodeエコシステムに直接挑戦。

11. Googleが構造化情報抽出ツールlangextractをオープンソース化、正確なソース定位を提供

Googleは、非構造化テキストから構造化情報を効率的に抽出できるLangExtractツールをオープンソース化しました。医療、文学、ビジネスなど複数の分野で使用可能で、開発者に強力なソリューションを提供しています。

image.png

【AiBase要約:】

🧠 正確なソース定位:抽出結果はソーステキストの具体的な位置にマッピングされ、データの正確性の検証や追跡が可能。

🧩 安定した構造化出力:少量の例を定義することで、ユーザーが予め定義したJSONスキーマに合った出力を保証。

📊 インタラクティブな可視化:HTMLレポートをワンクリックで生成し、抽出結果を直感的に確認し、審査効率を向上。

詳細リンク:https://github.com/google/langextract

12. Figma開発者モードの大規模更新:カラーチェックおよびMCPプロトコルの両方のアップグレードにより、デザインからコードへの転換効率が急上昇