AI日報：京東物流推出超腦大模型2.0；DeepSeek V3.1終結版發佈；Kimi 推出全新 Agent 模式

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、京東物流推出 “超腦大模型 2.0” 和 “異狼具身智能機械臂系統”

京東物流在JDDiscovery-2025大會上發佈了“超腦大模型2.0”和“異狼具身智能機械臂系統”，標誌着物流行業從“輔助決策”邁向“具身執行”時代。這些技術提升了物流供應鏈效率，並實現了智能化閉環系統。

【AiBase提要:】
🚀 京東物流發佈“超腦大模型2.0”和“異狼機械臂”，推動物流行業智能化升級。
📦 “超腦大模型2.0”可在2小時內解決千萬級變量，提升物流作業效率。
🤖 “異狼”機械臂具備自主學習能力，實現複雜包裹的高精度抓取操作。

2、DeepSeek V3.1終結版發佈：修復關鍵漏洞提升穩定性，V4新架構呼之欲出

DeepSeek發佈了V3.1-Terminus版本，顯著提升了模型穩定性並修復了關鍵問題。同時，該版本可能標誌着V3系列的結束，併爲即將推出的V4版本或R2重大更新鋪路。

【AiBase提要:】
✅ 提升模型穩定性，修復了中英文混雜輸出和異常字符問題。
🛠️ 優化Code Agent和Search Agent模塊，提高代碼生成和搜索準確性。
🚀 預示V4版本或R2重大更新，可能採用全新架構設計。

3、Kimi 推出全新 Agent 模式 “OK Computer”，開啓灰度測試

Kimi 推出了全新的 Agent 模式 'OK Computer'，並開啓了灰度測試。該模式基於 Kimi K2 模型，支持多功能智能服務，用戶只需簡單下達需求即可完成網站開發、數據分析等複雜任務。

【AiBase提要:】
🌟 Kimi 推出全新 Agent 模式 'OK Computer'，支持多功能智能服務。
💻 用戶可通過簡單需求下達，完成網站開發和數據分析等複雜任務。
🚀 Kimi K2 模型在自主編程和工具調用方面展現出卓越性能，參數總量達1T。

4、ChatGPT 全新上線個性化資訊功能，您的專屬新聞助手來了！

ChatGPT 推出個性化資訊功能，通過分析用戶對話歷史，爲用戶提供定製化的每日資訊，涵蓋多個領域，提升信息獲取效率。

【AiBase提要:】
🤖 ChatGPT 根據用戶聊天曆史推送個性化資訊
📰 資訊涵蓋新聞、科技、經濟等多個領域
💡 旨在提升用戶獲取信息的效率和體驗

5、LLM編碼幻覺終結者！Exa Code發佈，億級代碼索引讓AI代理零失誤

Exa Code是一款專爲Coding Agent優化的網絡上下文工具，通過索引大量文檔和代碼庫，提供高效、精確的代碼上下文，幫助大型語言模型避免生成錯誤代碼。其核心創新在於精準提取相關token，減少幻覺風險，並在多個場景中表現出色。

【AiBase提要:】
🔥 Exa Code是首個針對Coding Agent設計的專用解決方案，提升AI代理的可靠性。
💡 精確上下文提取確保信息密度最大化，避免冗長輸出。
🚀 免費開源且易於集成，適用於多種編程需求，加速開發流程。
詳情鏈接:https://exa.ai/blog/exa-code

6、Meta推出AI視頻生成平臺Vibes，輕鬆創作和分享 AI 短視頻

Meta 推出的 Vibes 平臺爲用戶提供了便捷的 AI 視頻創作工具，支持多種創作方式，並允許跨平臺分享，提升了用戶的創意體驗。

【AiBase提要:】
🎬 Vibes 是一個讓用戶輕鬆創建和分享 AI 生成短視頻的平臺。
🎨 用戶可以使用現有素材、從頭開始或 remix 動態進行創作。
📱 視頻可直接發佈到 Vibes 或跨平臺分享至 Instagram 和 Facebook。
詳情鏈接:https://about.fb.com/news/2025/09/introducing-vibes-ai-videos/

7、螞蟻數科發佈新隱私保護AI算法，推理速度提升超100倍

螞蟻數科憑藉其新推出的隱私保護AI訓練框架Gibbon，在隱私計算領域取得重大突破，顯著提升數據隱私與高效計算的平衡能力。

【AiBase提要:】
🧠 Gibbon框架通過創新的安全兩方訓練方式，顯著提升了傳統GBDT模型的訓練速度。
🔒 基於同態查找表的隱私保護決策圖推理技術，極大增強了數據隱私保護下的計算效率。
🌐 螞蟻數科構建了多元化的隱私計算產品矩陣，爲多個行業提供高安全、高性能的解決方案。

8、OpenAI 最新基準測試顯示 GPT-5 在多個行業中逐漸逼近人類專家

OpenAI 發佈了新的基準測試 GDPval，用於評估 AI 模型在多個行業與人類專業人士的表現。GPT-5 和 Claude Opus4.1 在部分任務中表現接近行業專家，但目前仍無法完全取代人類工作。測試涵蓋了九個主要行業和44種職業，並計劃未來推出更全面的測試。

【AiBase提要:】
🌟 OpenAI 發佈的新基準測試 GDPval 評估 AI 模型在多個行業的表現，與人類專家的能力逐漸接近。
🤖 GPT-5 模型在 44 種職業中有 40.6% 的任務表現優於或持平於行業專家，而 Claude Opus4.1 則爲 49%。
📈 OpenAI 計劃未來推出更全面的測試，以更準確評估 AI 在真實工作中的能力和表現。
詳情鏈接:https://openai.com/index/gdpval/

AI日報：京東物流推出超腦大模型2.0；DeepSeek V3.1終結版發佈；Kimi 推出全新 Agent 模式

相關推薦

AI日報：Anthropic發佈Claude Opus 4.6；千問“春節大免單”首日火爆；騰訊推出“火龍漫劇”

京東物流推出 “超腦大模型 2.0” 和 “異狼具身智能機械臂系統”

「6月30日AI日報」百度開源文心大模型4.5系列；通義千問多模態生成模型Qwen VLo

「6月27日AI日報」騰訊開源輕量級混元-A13B模型；可靈AI推“視頻音效”功能

「6月26日AI日報」可靈AI推全球首部AIGC單元劇；谷歌開源AI智能體Gemini CLI