歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、京東物流推出 “超腦大模型 2.0” 和 “異狼具身智能機械臂系統”

京東物流在JDDiscovery-2025大會上發佈了“超腦大模型2.0”和“異狼具身智能機械臂系統”,標誌着物流行業從“輔助決策”邁向“具身執行”時代。這些技術提升了物流供應鏈效率,並實現了智能化閉環系統。

【AiBase提要:】

🚀 京東物流發佈“超腦大模型2.0”和“異狼機械臂”,推動物流行業智能化升級。

📦 “超腦大模型2.0”可在2小時內解決千萬級變量,提升物流作業效率。

🤖 “異狼”機械臂具備自主學習能力,實現複雜包裹的高精度抓取操作。

2、DeepSeek V3.1終結版發佈:修復關鍵漏洞提升穩定性,V4新架構呼之欲出

DeepSeek發佈了V3.1-Terminus版本,顯著提升了模型穩定性並修復了關鍵問題。同時,該版本可能標誌着V3系列的結束,併爲即將推出的V4版本或R2重大更新鋪路。

image.png

【AiBase提要:】

✅ 提升模型穩定性,修復了中英文混雜輸出和異常字符問題。

🛠️ 優化Code Agent和Search Agent模塊,提高代碼生成和搜索準確性。

🚀 預示V4版本或R2重大更新,可能採用全新架構設計。

3、Kimi 推出全新 Agent 模式 “OK Computer”,開啓灰度測試

Kimi 推出了全新的 Agent 模式 'OK Computer',並開啓了灰度測試。該模式基於 Kimi K2 模型,支持多功能智能服務,用戶只需簡單下達需求即可完成網站開發、數據分析等複雜任務。


image.png

【AiBase提要:】

🌟 Kimi 推出全新 Agent 模式 'OK Computer',支持多功能智能服務。

💻 用戶可通過簡單需求下達,完成網站開發和數據分析等複雜任務。

🚀 Kimi K2 模型在自主編程和工具調用方面展現出卓越性能,參數總量達1T。

4、ChatGPT 全新上線個性化資訊功能,您的專屬新聞助手來了!

ChatGPT 推出個性化資訊功能,通過分析用戶對話歷史,爲用戶提供定製化的每日資訊,涵蓋多個領域,提升信息獲取效率。

【AiBase提要:】

🤖 ChatGPT 根據用戶聊天曆史推送個性化資訊

📰 資訊涵蓋新聞、科技、經濟等多個領域

💡 旨在提升用戶獲取信息的效率和體驗

5、LLM編碼幻覺終結者!Exa Code發佈,億級代碼索引讓AI代理零失誤

Exa Code是一款專爲Coding Agent優化的網絡上下文工具,通過索引大量文檔和代碼庫,提供高效、精確的代碼上下文,幫助大型語言模型避免生成錯誤代碼。其核心創新在於精準提取相關token,減少幻覺風險,並在多個場景中表現出色。


image.png

【AiBase提要:】

🔥 Exa Code是首個針對Coding Agent設計的專用解決方案,提升AI代理的可靠性。

💡 精確上下文提取確保信息密度最大化,避免冗長輸出。

🚀 免費開源且易於集成,適用於多種編程需求,加速開發流程。

詳情鏈接:https://exa.ai/blog/exa-code

6、Meta推出AI視頻生成平臺Vibes,輕鬆創作和分享 AI 短視頻

Meta 推出的 Vibes 平臺爲用戶提供了便捷的 AI 視頻創作工具,支持多種創作方式,並允許跨平臺分享,提升了用戶的創意體驗。


image.png

【AiBase提要:】

🎬 Vibes 是一個讓用戶輕鬆創建和分享 AI 生成短視頻的平臺。

🎨 用戶可以使用現有素材、從頭開始或 remix 動態進行創作。

📱 視頻可直接發佈到 Vibes 或跨平臺分享至 Instagram 和 Facebook。

詳情鏈接:https://about.fb.com/news/2025/09/introducing-vibes-ai-videos/

7、螞蟻數科發佈新隱私保護AI算法,推理速度提升超100倍

螞蟻數科憑藉其新推出的隱私保護AI訓練框架Gibbon,在隱私計算領域取得重大突破,顯著提升數據隱私與高效計算的平衡能力。

【AiBase提要:】

🧠 Gibbon框架通過創新的安全兩方訓練方式,顯著提升了傳統GBDT模型的訓練速度。

🔒 基於同態查找表的隱私保護決策圖推理技術,極大增強了數據隱私保護下的計算效率。

🌐 螞蟻數科構建了多元化的隱私計算產品矩陣,爲多個行業提供高安全、高性能的解決方案。

8、OpenAI 最新基準測試顯示 GPT-5 在多個行業中逐漸逼近人類專家

OpenAI 發佈了新的基準測試 GDPval,用於評估 AI 模型在多個行業與人類專業人士的表現。GPT-5 和 Claude Opus4.1 在部分任務中表現接近行業專家,但目前仍無法完全取代人類工作。測試涵蓋了九個主要行業和44種職業,並計劃未來推出更全面的測試。

【AiBase提要:】

🌟 OpenAI 發佈的新基準測試 GDPval 評估 AI 模型在多個行業的表現,與人類專家的能力逐漸接近。

🤖 GPT-5 模型在 44 種職業中有 40.6% 的任務表現優於或持平於行業專家,而 Claude Opus4.1 則爲 49%。

📈 OpenAI 計劃未來推出更全面的測試,以更準確評估 AI 在真實工作中的能力和表現。

詳情鏈接:https://openai.com/index/gdpval/