【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野のホットな情報をご提供し、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをいたします。

新鮮なAI製品クリックして詳細を確認https://top.aibase.com/

1. アリババがWebAgentプロジェクトWebShaperを開源、GAIA評価でClaude4-Sonnetを上回る

アリババクラウドの通義ラボが独自検索AIエージェントプロジェクト「WebAgent」をオープンソース化しました。その中で、WebSailorとWebShaperは多くの評価で優れた性能を示し、複雑なタスクにおける強力な能力を証明しています。このプロジェクトは使用のハードルを下げ、グローバルなAIコミュニティに産業レベルの訓練フレームワークと評価基準を提供します。

image.png

【AiBaseの要約:】

🌐 WebAgentは人間の検索行動をシミュレートし、複雑なネットワークタスクを効率的に処理します。

🔍 WebSailor-72Bモデルは権威ある評価で多数の閉鎖型モデルを上回り、優れた性能を示しています。

📊 WebShaperは形式的駆動のデータ合成方法を使用し、多段階推論の正確性を向上させています。

詳細リンク:https://github.com/Alibaba-NLP/WebAgent

2. MoonvalleyがSketch-to-Video機能をリリース:手書きスケッチから映画級ビデオへ瞬時に変換

Moonvalleyが提供するSketch-to-Video機能は、手書きスケッチとテキスト説明をもとに高品質なビデオを生成します。これは映画制作、広告クリエイティブ、個人創作に便利なツールです。この機能はMareyモデルを基盤としており、正確な制御と倫理的保証を持ち、ビデオ制作のコストと障壁を顕著に低下させます。

image.png

【AiBaseの要約:】

✨ Sketch-to-Videoは手書きスケッチとテキストで映画級のビデオセグメントを生成できます。

🎥 Mareyモデルは認証済み素材でトレーニングされ、著作権の安全を確保し、ビデオ品質を向上させます。

💡 この機能はビデオ制作コストを大幅に削減し、グローバルなクリエイターを支援し、AIと映画業界の深く融合を促進します。

3. 腾讯AI新進展:X-Omniモデルでスマート生成が書字困難症を克服、画像とテキストの理解・生成を一歩で完了

腾讯研究チームがリリースしたX-OmniマルチモーダルAIモデルは、画像生成と理解の分野で大きな進展を遂げました。特に長文レンダリングにおいて優れた性能を示し、従来のAIモデルの文字生成における正確性の問題を解決しました。このモデルは強化学習フレームワークと統一モデリング技術を用いて、出力品質の安定性と正確性を大幅に向上させています。

image.png

【AiBaseの要約:】

✨ X-Omniは強化学習フレームワークでモデル性能を最適化し、多次元報酬メカニズムを導入して文字レンダリングの正確性を向上させます。

🧠 画像生成と理解の機能を統一モデリングし、異なるモデル構造やトレーニング戦略を必要としません。

🚀 いくつかのベンチマークテストで優れた成績を収め、特に長文レンダリングと画像理解タスクで主流モデルを上回っています。

詳細リンク:https://arxiv.org/pdf/2507.22058

4. 百度検索トップページがAIアプリケーションセンターに変わる?スマートエージェントへのアクセスがテスト中

百度検索はパソコン端末のトップページでスマートエージェントアプリケーションへのアクセスを試験的に開放しています。ユーザーは今後、検索バーの下からさまざまなAIアプリケーションに直接アクセスできるようになります。この機能は現在、テストフェーズにあり、近く全体的に公開される予定です。

image.png

【AiBaseの要約:】

📌 百度検索はトップページにスマートエージェントアプリケーションへのアクセスを開放する予定で、ユーザーの検索体験を向上させます。

💡 スマートエージェントは主に文心スマートエージェントプラットフォーム、外部の優れたAIアプリケーション、および百度自社のアプリケーションから来ます。

🌐 現在この機能はテストフェーズにあり、百度公式からの正式なコメントはまだありません。

5. Midjourneyが「あなたにぴったりの推奨」機能をリリース:ワンクリックでパーソナライズされた画像と動画の体験を解禁

Midjourneyは探求ページに「あなたにぴったりの推奨」ボタンを追加しました。この機能はユーザーの過去の相互作用データと好み学習アルゴリズムに基づき、パーソナライズされたAI生成画像と動画の推奨を提供します。これにより、ユーザーの創造効率と個別体験が大きく向上しました。

image.png

【AiBaseの要約:】

✨ ユーザーが「あなたにぴったりの推奨」ボタンをクリックすると、自身のスタイルに合ったクリエイティブコンテンツを得られます。

🔍 システムはユーザーの過去の操作(いいね、moodboardのアップロードなど)を分析し、スタイルの好みを把握します。

🎨 推奨結果はパラメータ調整が可能で、出力効果を最適化します。

6. GPT-5の発表が近づいている!GPT-5-AutoとGPT-5-ReasoningがMacクライアントに登場

記事はOpenAIがGPT-5の2つの新しいモデルであるGPT-5-AutoとGPT-5-Reasoningをテストしている可能性があることを明らかにしました。これらの発見は、次の世代のAIモデルが内部テスト段階に入ったことを示しており、2025年夏に正式にリリースされる予定です。

image.png

【AiBaseの要約:】

🤖 GPT-5-Reasoningは複雑なタスクの論理分解と多段階推論に特化しており、優れた性能を発揮しています。

🔄 GPT-5-Autoは高い自動化能力を持ち、多段階タスクを実行でき、ユーザーの介入を最小限に抑えます。

📅 OpenAIは2025年夏にGPT-5を正式リリースする計画で、開発プロセスを加速しています。

7. Ollamaがデスクトップクライアントをリリース!ドロップ&ドロップ文書、マルチモーダル認識、ローカルAIはコマンドラインから解放

Ollamaはデスクトップクライアントをリリースし、ユーザーにより直感的なインタラクション体験を提供しました。このクライアントはマルチモーダル認識とドキュメントドロップ機能をサポートし、同時にローカル実行の利点を維持し、プライバシー保護と効率を向上させています。

image.png

【AiBaseの要約:】

📱 グラフィカルインターフェースで操作を簡素化し、使用のハードルを下げます。

🖼️ マルチモーダル認識は画像とテキストの相互作用をサポートし、応用の多様性を高めます。

🔒 ローカル実行はデータプライバシーを保障し、コンプライアンス要件を満たします。

詳細リンク:https://ollama.com/download

8. OWLチームが新たなマルチエージェントツールEigentをオープンソース化:複雑なタスク処理効率を革新

OWLチームは新たなマルチエージェント協働ツールEigentをリリースしました。このツールは、マルチエージェント協働を通じて複雑なタスクの処理効率を向上させる目的で設計されています。CAMELとOWLの成功経験を引き継ぎ、効率的な並列処理メカニズム、柔軟なカスタマイズ能力、そしてHuman-in-the-Loopメカニズムを導入し、AIオープンソースエコシステムに大きなブレイクスルーをもたらしました。

image.png

【AiBaseの要約:】

🧠 **効率的なタスク分解と並列処理**:Eigentは多層並列メカニズムを通じてタスク処理効率を著しく向上させます。

🛠️ **柔軟なカスタマイズとツール統合**:Workforceの動的作成をサポートし、さまざまなデータソースとツールを統合し、適用性を高めます。

🤝 **Human-in-the-Loopメカニズム**:ユーザーが重要なポイントで人為的な介入を行うことができ、タスクの精度と主観的な判断を確保します。

詳細リンク:https://github.com/eigent-ai/eigent

9. OpenAIの今年の収益が急増!120億ドル、週アクティブユーザーが7億を突破

OpenAIは2023年に大きな商業的成果を収め、前7か月で収益が120億ドルに達しました。月収は10億ドルに達する見込みです。週アクティブユーザー数は7億を突破し、製品の広範な市場の認知を示しています。会社の目標は2029年に年収を1250億ドルに増やすことです。

image.png

【AiBaseの要約:】

🌟 OpenAIは今年の前7か月で収益が120億ドルに達し、月収は10億ドルに達する見込みです。

📈 週アクティブユーザー数は7億を突破し、ChatGPTはグローバルなユーザーから好評を博しています。

🚀 OpenAIの目標は2029年に年収を1250億ドルに増やすことで、雄大な野心を示しています。

10. インテルH20演算チップが呼び出しを受けた:国家情報辦公室が「トラッキングと定位」および「リモートオフ」リスクについて説明を要求

国家インターネット情報弁公室はインテルH20演算チップのセキュリティリスク、特に「トラッキングと定位」と「リモートオフ」技術について、インテルに対して呼び出しを行いました。インターネット情報弁公室は、インテルが中国向けに販売するH20チップの脆弱性とバックドアのセキュリティリスクについて詳細な説明を求め、関連する証明資料を提出するように求めました。

image.png

【AiBaseの要約:】

📌 国家インターネット情報弁公室がインテルを呼び出し、H20チップの「トラッキングと定位」および「リモートオフ」技術のリスクについて注目しています。

💡 インテルの演算チップには重大なセキュリティの欠陥があり、関連技術はすでに完成しています。

🔍 弁公室は『サイバーセキュリティ法』などの規則に基づいて、インテルに詳細な説明と証明資料を提供するよう求めています。

11. 萬興科技が驚異的なランクイン!天幕2.0モデルが国内第4位に、华为云と共同でAIビデオ研究所を設立

萬興科技は天幕2.0モデルの優れた性能により、AIビデオ生成分野で顕著な進展を遂げ、華為雲と深い協力を進め、AI技術の応用可能性を探求しています。