AI日報：GPT-5-Auto現身Mac客戶端；阿里開源WebAgent項目WebShaper；騰訊推X-Omni多模態模型

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、阿里開源WebAgent項目WebShaper，GAIA評測超過Claude4-Sonnet

阿里雲通義實驗室開源了其自主搜索AI智能體項目WebAgent，其中WebSailor和WebShaper在多個評測中表現優異，展示了其在複雜任務中的強大能力。該項目不僅降低了使用門檻，還爲全球AI社區提供了工業級訓練框架和評估標準。

【AiBase提要:】
🌐 WebAgent通過模擬人類搜索行爲，實現高效處理複雜網絡任務。
🔍 WebSailor-72B模型在權威評測中超越多數閉源模型，展現卓越性能。
📊 WebShaper採用形式化驅動的數據合成方法，提升多步推理準確性。
詳情鏈接:https://github.com/Alibaba-NLP/WebAgent

2、Moonvalley發佈Sketch-to-Video功能：手繪草圖秒變電影級視頻

Moonvalley推出的Sketch-to-Video功能通過手繪草圖和文本描述生成高質量視頻，爲影視製作、廣告創意及個人創作提供了便捷的工具。該功能依託Marey模型，具備精準控制和倫理保障，顯著降低了視頻製作成本與門檻。

【AiBase提要:】
✨ Sketch-to-Video允許用戶通過手繪草圖和文本生成電影級視頻片段。
🎥 Marey模型使用授權素材訓練，確保版權安全並提升視頻質量。
💡 該功能大幅降低視頻製作成本，賦能全球創作者並推動AI與影視行業的深度融合。

3、騰訊AI新突破：X-Omni模型讓智能生成告別寫字困難症，圖文理解生成一步到位

騰訊研究團隊推出的X-Omni多模態AI模型在圖像生成和理解領域實現了重大突破，特別是在長文本渲染方面表現出色，解決了傳統AI模型在文字生成中的準確性問題。該模型通過強化學習框架和統一建模技術，顯著提升了輸出質量的穩定性和準確性。

【AiBase提要:】
✨ X-Omni採用強化學習框架優化模型性能，引入多維度獎勵機制提升文字渲染準確率。
🧠 實現圖像生成與理解功能的統一建模，無需不同模型架構和訓練策略。
🚀 在多個基準測試中表現優異，尤其在長文本渲染和圖像理解任務中超越主流模型。
詳情鏈接:https://arxiv.org/pdf/2507.22058

4、百度搜索首頁將變身AI應用中心?智能體入口灰度測試中

百度搜索正在測試在電腦端首頁開放智能體應用入口，用戶未來可能直接在搜索框下方訪問各類AI應用。該功能目前處於灰度測試階段，預計不久將全面開放。

【AiBase提要:】
📌 百度搜索計劃在首頁開放智能體應用入口，提升用戶搜索體驗。
💡 智能體主要來源於文心智能體平臺、外部優質AI應用及百度自研應用。
🌐 目前該功能處於灰度測試階段，尚未得到百度官方正式迴應。

5、Midjourney 推出“爲您推薦”功能:一鍵解鎖個性化圖片與視頻體驗

Midjourney 在探索頁面新增了‘爲您推薦’按鈕，基於用戶歷史交互數據和偏好學習算法，提供個性化AI生成的圖片和視頻推薦。這一功能極大提升了用戶的創作效率和個性化體驗。

【AiBase提要:】
✨ 用戶點擊‘爲您推薦’按鈕即可獲取符合自身風格的創意內容。
🔍 系統通過分析用戶的歷史操作（如點贊、moodboard上傳）捕捉風格偏好。
🎨 推薦結果支持參數調整，優化輸出效果。

6、GPT-5發佈越來越近！GPT-5-Auto 與 GPT-5-Reasoning 現身 Mac 客戶端

文章揭示了OpenAI可能正在測試GPT-5的兩個新模型，GPT-5-Auto和GPT-5-Reasoning，這些發現暗示其下一代AI模型已進入內部測試階段，預計2025年夏季正式發佈。

【AiBase提要:】
🤖 GPT-5-Reasoning專注於複雜任務的邏輯拆解與多步推理，表現出色。
🔄 GPT-5-Auto具備高度自動化能力，可執行多步驟任務，減少用戶干預。
📅 OpenAI計劃在2025年夏季正式發佈GPT-5，加速開發進程。

7、Ollama發佈桌面客戶端！拖拽文檔、多模態識別，本地AI從此告別命令行

Ollama推出了桌面客戶端，爲用戶提供了更直觀的交互體驗。該客戶端支持多模態識別和文檔拖拽功能，同時保持了本地運行的優勢，提升了隱私保護和效率。

【AiBase提要:】
📱 圖形化界面簡化操作，降低使用門檻。
🖼️ 多模態識別支持圖像與文本交互，提升應用多樣性。
🔒 本地運行保障數據隱私，滿足合規要求。
詳情鏈接:https://ollama.com/download

8、OWL團隊開源全新多智能體工具Eigent:革新複雜任務處理效率

OWL團隊推出了全新的多智能體協作工具Eigent，旨在通過多智能體協作提升複雜任務的處理效率。該工具繼承了CAMEL和OWL的成功經驗，並引入了高效的並行處理機制、靈活的定製能力以及Human-in-the-Loop機制，爲AI開源生態帶來了重大突破。

【AiBase提要:】
🧠 **高效任務拆解與並行處理**：Eigent通過多層次並行機制顯著提升任務處理效率。
🛠️ **靈活定製與工具整合**：支持動態創建Workforce，整合多種數據源和工具，提高適用性。
🤝 **Human-in-the-Loop機制**：允許用戶在關鍵節點進行人工干預，確保任務精度和主觀判斷。
詳情鏈接:https://github.com/eigent-ai/eigent

9、OpenAI 今年收入激增至 120 億美元周活躍用戶破 7 億大關

OpenAI 在2023年取得了顯著的商業成就，前七個月收入達到120億美元，預計月收入將達到10億美元。周活躍用戶數突破7億，顯示出其產品的廣泛市場認可。公司目標到2029年實現年收入1250億美元。

【AiBase提要:】
🌟 OpenAI 今年前七個月收入達120億美元，月收入預計10億美元。
📈 周活躍用戶突破7億，ChatGPT 受到全球用戶歡迎。
🚀 OpenAI 目標到2029年年收入增至1250億美元，展現雄心壯志。

10、英偉達H20算力芯片被約談:國信辦要求說明“追蹤定位”及“遠程關閉”風險

國家互聯網信息辦公室就英偉達H20算力芯片的安全風險，特別是‘追蹤定位’和‘遠程關閉’技術，對英偉達公司進行了約談。網信辦要求英偉達詳細說明其對華銷售的H20芯片的漏洞後門安全風險問題，並提交相關證明材料。

【AiBase提要:】
📌 國家互聯網信息辦公室約談英偉達，關注其H20芯片的‘追蹤定位’和‘遠程關閉’技術風險。
💡 英偉達的算力芯片存在嚴重安全漏洞，且相關技術已成熟。
🔍 網信辦依據《網絡安全法》等法規，要求英偉達提供詳細說明和證明材料。

11、萬興科技驚豔登榜！天幕2.0模型成國內第四，攜手華爲雲共建AI視頻實驗室

萬興科技憑藉天幕2.0模型的出色表現，在AI視頻生成領域取得顯著進展，並與華爲雲展開深度合作，共同探索AI技術的應用潛力。

【AiBase提要:】
🎥 萬興天幕2.0模型在SuperCLUE榜單中位列國內第四，展現了其強大的技術實力。
🤝 與華爲雲共建AI視頻大模型實驗室，推動行業技術革新。
🚀 未來合作有望拓展至更多領域，提升用戶數字創意體驗。

AI日報：GPT-5-Auto現身Mac客戶端；阿里開源WebAgent項目WebShaper；騰訊推X-Omni多模態模型

相關AI新聞推薦

GitHub C opilot 用戶突破 2000 萬，AI 編程工具引領新潮流！

字節豆包大模型日均調用量激增 137 倍，推出多項新產品

OpenAI 在挪威啓用首個歐洲人工智能數據中心

Manus即將推出Wide Research功能開啓多智能體並行處理新時代

AI大模型用戶註冊數量突破31億，服務覆蓋面持續擴大

萬興科技驚豔登榜！天幕2.0模型成國內第四，攜手華爲雲共建AI視頻實驗室

AI日報：GPT-5-Auto現身Mac客戶端；阿里開源WebAgent項目WebShaper；騰訊推X-Omni多模態模型

相關AI新聞推薦

GitHub C opilot 用戶突破 2000 萬，AI 編程工具引領新潮流！

字節豆包大模型日均調用量激增 137 倍，推出多項新產品

​OpenAI 在挪威啓用首個歐洲人工智能數據中心

Manus即將推出Wide Research功能 開啓多智能體並行處理新時代

AI大模型用戶註冊數量突破31億，服務覆蓋面持續擴大

萬興科技驚豔登榜！天幕2.0模型成國內第四，攜手華爲雲共建AI視頻實驗室

OpenAI 在挪威啓用首個歐洲人工智能數據中心

Manus即將推出Wide Research功能開啓多智能體並行處理新時代