歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、京東物流推出 “超腦大模型 2.0” 和 “異狼具身智能機械臂系統”
京東物流在JDDiscovery-2025大會上發佈了“超腦大模型2.0”和“異狼具身智能機械臂系統”,標誌着物流行業從“輔助決策”邁向“具身執行”時代。這些技術提升了物流供應鏈效率,並實現了智能化閉環系統。
【AiBase提要:】
🚀 京東物流發佈“超腦大模型2.0”和“異狼機械臂”,推動物流行業智能化升級。
📦 “超腦大模型2.0”可在2小時內解決千萬級變量,提升物流作業效率。
🤖 “異狼”機械臂具備自主學習能力,實現複雜包裹的高精度抓取操作。
2、DeepSeek V3.1終結版發佈:修復關鍵漏洞提升穩定性,V4新架構呼之欲出
DeepSeek發佈了V3.1-Terminus版本,顯著提升了模型穩定性並修復了關鍵問題。同時,該版本可能標誌着V3系列的結束,併爲即將推出的V4版本或R2重大更新鋪路。

【AiBase提要:】
✅ 提升模型穩定性,修復了中英文混雜輸出和異常字符問題。
🛠️ 優化Code Agent和Search Agent模塊,提高代碼生成和搜索準確性。
🚀 預示V4版本或R2重大更新,可能採用全新架構設計。
3、Kimi 推出全新 Agent 模式 “OK Computer”,開啓灰度測試
Kimi 推出了全新的 Agent 模式 'OK Computer',並開啓了灰度測試。該模式基於 Kimi K2 模型,支持多功能智能服務,用戶只需簡單下達需求即可完成網站開發、數據分析等複雜任務。

【AiBase提要:】
🌟 Kimi 推出全新 Agent 模式 'OK Computer',支持多功能智能服務。
💻 用戶可通過簡單需求下達,完成網站開發和數據分析等複雜任務。
🚀 Kimi K2 模型在自主編程和工具調用方面展現出卓越性能,參數總量達1T。
4、ChatGPT 全新上線個性化資訊功能,您的專屬新聞助手來了!
ChatGPT 推出個性化資訊功能,通過分析用戶對話歷史,爲用戶提供定製化的每日資訊,涵蓋多個領域,提升信息獲取效率。
【AiBase提要:】
🤖 ChatGPT 根據用戶聊天曆史推送個性化資訊
📰 資訊涵蓋新聞、科技、經濟等多個領域
💡 旨在提升用戶獲取信息的效率和體驗
5、LLM編碼幻覺終結者!Exa Code發佈,億級代碼索引讓AI代理零失誤
Exa Code是一款專爲Coding Agent優化的網絡上下文工具,通過索引大量文檔和代碼庫,提供高效、精確的代碼上下文,幫助大型語言模型避免生成錯誤代碼。其核心創新在於精準提取相關token,減少幻覺風險,並在多個場景中表現出色。

【AiBase提要:】
🔥 Exa Code是首個針對Coding Agent設計的專用解決方案,提升AI代理的可靠性。
💡 精確上下文提取確保信息密度最大化,避免冗長輸出。
🚀 免費開源且易於集成,適用於多種編程需求,加速開發流程。
詳情鏈接:https://exa.ai/blog/exa-code
6、Meta推出AI視頻生成平臺Vibes,輕鬆創作和分享 AI 短視頻
Meta 推出的 Vibes 平臺爲用戶提供了便捷的 AI 視頻創作工具,支持多種創作方式,並允許跨平臺分享,提升了用戶的創意體驗。

【AiBase提要:】
🎬 Vibes 是一個讓用戶輕鬆創建和分享 AI 生成短視頻的平臺。
🎨 用戶可以使用現有素材、從頭開始或 remix 動態進行創作。
📱 視頻可直接發佈到 Vibes 或跨平臺分享至 Instagram 和 Facebook。
詳情鏈接:https://about.fb.com/news/2025/09/introducing-vibes-ai-videos/
7、螞蟻數科發佈新隱私保護AI算法,推理速度提升超100倍
螞蟻數科憑藉其新推出的隱私保護AI訓練框架Gibbon,在隱私計算領域取得重大突破,顯著提升數據隱私與高效計算的平衡能力。
【AiBase提要:】
🧠 Gibbon框架通過創新的安全兩方訓練方式,顯著提升了傳統GBDT模型的訓練速度。
🔒 基於同態查找表的隱私保護決策圖推理技術,極大增強了數據隱私保護下的計算效率。
🌐 螞蟻數科構建了多元化的隱私計算產品矩陣,爲多個行業提供高安全、高性能的解決方案。
8、OpenAI 最新基準測試顯示 GPT-5 在多個行業中逐漸逼近人類專家
OpenAI 發佈了新的基準測試 GDPval,用於評估 AI 模型在多個行業與人類專業人士的表現。GPT-5 和 Claude Opus4.1 在部分任務中表現接近行業專家,但目前仍無法完全取代人類工作。測試涵蓋了九個主要行業和44種職業,並計劃未來推出更全面的測試。
【AiBase提要:】
🌟 OpenAI 發佈的新基準測試 GDPval 評估 AI 模型在多個行業的表現,與人類專家的能力逐漸接近。
🤖 GPT-5 模型在 44 種職業中有 40.6% 的任務表現優於或持平於行業專家,而 Claude Opus4.1 則爲 49%。
📈 OpenAI 計劃未來推出更全面的測試,以更準確評估 AI 在真實工作中的能力和表現。
詳情鏈接:https://openai.com/index/gdpval/
