歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://top.aibase.com/

1、阿里開源WebAgent項目WebShaper,GAIA評測超過Claude4-Sonnet

阿里雲通義實驗室開源了其自主搜索AI智能體項目WebAgent,其中WebSailor和WebShaper在多個評測中表現優異,展示了其在複雜任務中的強大能力。該項目不僅降低了使用門檻,還爲全球AI社區提供了工業級訓練框架和評估標準。


image.png

【AiBase提要:】

🌐 WebAgent通過模擬人類搜索行爲,實現高效處理複雜網絡任務。

🔍 WebSailor-72B模型在權威評測中超越多數閉源模型,展現卓越性能。

📊 WebShaper採用形式化驅動的數據合成方法,提升多步推理準確性。

詳情鏈接:https://github.com/Alibaba-NLP/WebAgent

2、Moonvalley發佈Sketch-to-Video功能:手繪草圖秒變電影級視頻

Moonvalley推出的Sketch-to-Video功能通過手繪草圖和文本描述生成高質量視頻,爲影視製作、廣告創意及個人創作提供了便捷的工具。該功能依託Marey模型,具備精準控制和倫理保障,顯著降低了視頻製作成本與門檻。

【AiBase提要:】

✨ Sketch-to-Video允許用戶通過手繪草圖和文本生成電影級視頻片段。

🎥 Marey模型使用授權素材訓練,確保版權安全並提升視頻質量。

💡 該功能大幅降低視頻製作成本,賦能全球創作者並推動AI與影視行業的深度融合。

3、騰訊AI新突破:X-Omni模型讓智能生成告別寫字困難症,圖文理解生成一步到位

騰訊研究團隊推出的X-Omni多模態AI模型在圖像生成和理解領域實現了重大突破,特別是在長文本渲染方面表現出色,解決了傳統AI模型在文字生成中的準確性問題。該模型通過強化學習框架和統一建模技術,顯著提升了輸出質量的穩定性和準確性。

image.png

【AiBase提要:】

✨ X-Omni採用強化學習框架優化模型性能,引入多維度獎勵機制提升文字渲染準確率。

🧠 實現圖像生成與理解功能的統一建模,無需不同模型架構和訓練策略。

🚀 在多個基準測試中表現優異,尤其在長文本渲染和圖像理解任務中超越主流模型。

詳情鏈接:https://arxiv.org/pdf/2507.22058

4、百度搜索首頁將變身AI應用中心?智能體入口灰度測試中

百度搜索正在測試在電腦端首頁開放智能體應用入口,用戶未來可能直接在搜索框下方訪問各類AI應用。該功能目前處於灰度測試階段,預計不久將全面開放。


image.png

【AiBase提要:】

📌 百度搜索計劃在首頁開放智能體應用入口,提升用戶搜索體驗。

💡 智能體主要來源於文心智能體平臺、外部優質AI應用及百度自研應用。

🌐 目前該功能處於灰度測試階段,尚未得到百度官方正式迴應。

5、Midjourney 推出“爲您推薦”功能:一鍵解鎖個性化圖片與視頻體驗

Midjourney 在探索頁面新增了‘爲您推薦’按鈕,基於用戶歷史交互數據和偏好學習算法,提供個性化AI生成的圖片和視頻推薦。這一功能極大提升了用戶的創作效率和個性化體驗。


image.png

【AiBase提要:】

✨ 用戶點擊‘爲您推薦’按鈕即可獲取符合自身風格的創意內容。

🔍 系統通過分析用戶的歷史操作(如點贊、moodboard上傳)捕捉風格偏好。

🎨 推薦結果支持參數調整,優化輸出效果。

6、GPT-5發佈越來越近!GPT-5-Auto 與 GPT-5-Reasoning 現身 Mac 客戶端

文章揭示了OpenAI可能正在測試GPT-5的兩個新模型,GPT-5-Auto和GPT-5-Reasoning,這些發現暗示其下一代AI模型已進入內部測試階段,預計2025年夏季正式發佈。


image.png

【AiBase提要:】

🤖 GPT-5-Reasoning專注於複雜任務的邏輯拆解與多步推理,表現出色。

🔄 GPT-5-Auto具備高度自動化能力,可執行多步驟任務,減少用戶干預。

📅 OpenAI計劃在2025年夏季正式發佈GPT-5,加速開發進程。

7、Ollama發佈桌面客戶端!拖拽文檔、多模態識別,本地AI從此告別命令行

Ollama推出了桌面客戶端,爲用戶提供了更直觀的交互體驗。該客戶端支持多模態識別和文檔拖拽功能,同時保持了本地運行的優勢,提升了隱私保護和效率。


image.png

【AiBase提要:】

📱 圖形化界面簡化操作,降低使用門檻。

🖼️ 多模態識別支持圖像與文本交互,提升應用多樣性。

🔒 本地運行保障數據隱私,滿足合規要求。

詳情鏈接:https://ollama.com/download

8、OWL團隊開源全新多智能體工具Eigent:革新複雜任務處理效率

OWL團隊推出了全新的多智能體協作工具Eigent,旨在通過多智能體協作提升複雜任務的處理效率。該工具繼承了CAMEL和OWL的成功經驗,並引入了高效的並行處理機制、靈活的定製能力以及Human-in-the-Loop機制,爲AI開源生態帶來了重大突破。


image.png


【AiBase提要:】

🧠 **高效任務拆解與並行處理**:Eigent通過多層次並行機制顯著提升任務處理效率。

🛠️ **靈活定製與工具整合**:支持動態創建Workforce,整合多種數據源和工具,提高適用性。

🤝 **Human-in-the-Loop機制**:允許用戶在關鍵節點進行人工干預,確保任務精度和主觀判斷。

詳情鏈接:https://github.com/eigent-ai/eigent

9、OpenAI 今年收入激增至 120 億美元 周活躍用戶破 7 億大關

OpenAI 在2023年取得了顯著的商業成就,前七個月收入達到120億美元,預計月收入將達到10億美元。周活躍用戶數突破7億,顯示出其產品的廣泛市場認可。公司目標到2029年實現年收入1250億美元。

【AiBase提要:】

🌟 OpenAI 今年前七個月收入達120億美元,月收入預計10億美元。

📈 周活躍用戶突破7億,ChatGPT 受到全球用戶歡迎。

🚀 OpenAI 目標到2029年年收入增至1250億美元,展現雄心壯志。

10、英偉達H20算力芯片被約談:國信辦要求說明“追蹤定位”及“遠程關閉”風險

國家互聯網信息辦公室就英偉達H20算力芯片的安全風險,特別是‘追蹤定位’和‘遠程關閉’技術,對英偉達公司進行了約談。網信辦要求英偉達詳細說明其對華銷售的H20芯片的漏洞後門安全風險問題,並提交相關證明材料。

【AiBase提要:】

📌 國家互聯網信息辦公室約談英偉達,關注其H20芯片的‘追蹤定位’和‘遠程關閉’技術風險。

💡 英偉達的算力芯片存在嚴重安全漏洞,且相關技術已成熟。

🔍 網信辦依據《網絡安全法》等法規,要求英偉達提供詳細說明和證明材料。

11、萬興科技驚豔登榜!天幕2.0模型成國內第四,攜手華爲雲共建AI視頻實驗室

萬興科技憑藉天幕2.0模型的出色表現,在AI視頻生成領域取得顯著進展,並與華爲雲展開深度合作,共同探索AI技術的應用潛力。


image.png

【AiBase提要:】

🎥 萬興天幕2.0模型在SuperCLUE榜單中位列國內第四,展現了其強大的技術實力。

🤝 與華爲雲共建AI視頻大模型實驗室,推動行業技術革新。

🚀 未來合作有望拓展至更多領域,提升用戶數字創意體驗。