歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、豆包大模型1.6-vision正式發佈,對比上一代綜合成本降低約50%

豆包大模型1.6-vision的發佈標誌着其在多模態理解和推理能力上的重大突破,同時通過引入工具調用功能和優化性能,顯著提升了開發效率和性價比。

image.png

【AiBase提要:】

🧠 調用工具,視覺理解更精準。

💻 應用開發更高效。

💰 更高模型性價比。

2、通義千問發佈Qwen3-LiveTranslate-Flash3 秒同傳延遲刷新行業紀錄

通義千問推出的Qwen3-LiveTranslate-Flash系統,實現了多語言實時音視頻翻譯的突破。該系統支持 18 種語言及多種方言,並通過視覺上下文增強技術提升翻譯準確性,同時實現最低 3 秒的同傳延遲,顯著優於其他主流模型。

image.png

【AiBase提要:】

🌍 支持 18 種語言及多種方言,覆蓋廣泛的語言需求。

🧠 引入視覺上下文增強技術,提升複雜語境下的翻譯準確率。

⏱️ 實現最低 3 秒同傳延遲,大幅提升實時翻譯流暢性。

3、DeepSeek發佈V3.2-exp模型,開創性稀疏注意力機制 將API 成本降低一半

DeepSeek發佈了名爲V3.2-exp的新實驗模型,通過創新的‘稀疏注意力’機制顯著降低了長上下文操作的推理成本。該模型結合了‘閃電索引器’和‘細粒度標記選擇系統’,提高了處理長上下文片段的效率,並在初步測試中展示了API調用成本降低50%的優勢。

QQ20250930-085622.png

【AiBase提要:】

⚡ DeepSeek推出V3.2-exp模型,採用稀疏注意力機制優化長上下文處理。

🔍 閃電索引器與細粒度標記選擇系統協同提升模型效率。

💰 初步測試顯示API調用成本降低達50%,爲AI應用提供更經濟的解決方案。

4、Anthropic放大招!Claude Sonnet4.5碾壓GPT-5,編碼界“新王者”誕生

Anthropic發佈了Claude Sonnet4.5模型,該模型在編碼任務和複雜任務處理上表現出色,成爲當前最優秀的編碼模型之一。其性能提升顯著,支持多平臺使用,並且在安全性和對齊性方面也有所增強。

image.png

【AiBase提要:】

✅ Claude Sonnet4.5在編碼基準測試中表現優異,實現30小時以上的自主工作時長。

🔧 新增功能如檢查點、上下文編輯和內存工具,提升了開發效率與實用性。

🔒 強調安全性,降低風險行爲,適用於高風險企業場景。

5、ChatGPT 聊天即買!AI 革命電商:一鍵下單,告別瀏覽器跳轉

ChatGPT 推出‘即時結賬’功能,用戶可在聊天界面直接完成單件商品購買,無需跳轉鏈接或瀏覽器。該功能由 OpenAI 與 Stripe 合作開發的‘代理商務協議’驅動,支持多種支付方式,並將擴展至多件購物車和國際市場。

【AiBase提要:】

💡 ChatGPT 推出‘即時結賬’功能,實現聊天界面直接下單。

🔒 ‘代理商務協議’確保交易安全、簡易且兼容多種支付方式。

🌐 未來將擴展至多件購物車和國際市場,提升用戶體驗。

6、OpenAI 即將推出AI版TikTok,全網視頻內容將由AI創造

OpenAI即將推出一款基於Sora2模型的社交應用,名爲‘AI版TikTok’,所有內容均由AI生成。該應用設計類似TikTok,但視頻時長限制爲10秒,且支持用戶身份認證和肖像使用。此外,OpenAI還注重安全與版權問題,以提升用戶體驗和防止用戶流失。

【AiBase提要:】

🎥 Sora2模型生成的視頻時長限制爲10秒,專注於短小精悍的內容傳播。

🔒 用戶可認證身份,Sora2可使用其肖像進行視頻生成,並允許其他用戶標記使用。

🛡️ OpenAI將發送提醒,確保用戶在使用肖像時知情,同時處理版權問題。

7、Claude Code 2.0震撼升級:檢查點+VS Code插件,編程效率飆升3倍

Anthropic發佈了Claude Code v2.0和Claude Sonnet4.5模型的更新,顯著提升了AI在編程中的自主性和集成性。Claude Code通過檢查點機制、終端與IDE的優化以及API擴展,爲開發者提供了更高效的編程體驗。

image.png

【AiBase提要:】

✅ Claude Code v2.0引入了檢查點功能,使AI能自動保存狀態並支持回滾,提升開發安全性。

🔧 VS Code原生擴展進入beta測試階段,提供內聯差異預覽和圖形化交互,提高協作效率。

📈 Sonnet4.5模型在OSWorld基準測試中得分高達61.4%,表現出色,尤其擅長構建複雜代理系統。

8、百度地圖升級小度想想 2.0:出行智能助手全面進化

百度地圖在第七屆世界新能源汽車大會上發佈了小度想想 2.0,這一版本作爲行業首個深度融合的端到端語音語言大模型,爲用戶提供更智能、個性化的出行服務。其核心優勢包括:引入地圖出行知識庫和實時搜索數據以提升複雜出行意圖的理解;構建跨端記憶體以實現多設備間的無縫銜接;以及具備即時、近期及長期記憶能力,從而提供個性化的推薦服務。

【AiBase提要:】

🚗 百度地圖引入地圖出行知識庫和實時搜索數據,提升複雜出行意圖的理解與推理能力。

📱 跨端記憶體實現手機、車機等多場景無縫銜接,提升用戶體驗。

🧠 智能助手具備即時、近期及長期記憶能力,提供個性化推薦服務。

9、螞蟻集團開源全球首個萬億參數大模型 Ring-1T-preview

螞蟻集團推出的Ring-1T-preview是全球首個開源的萬億參數推理大模型,在多項測試中表現優異,超越了多個已知開源模型,接近GPT-5。該模型在自然語言推理和代碼生成方面展現出強大的能力,並且團隊正在對其進行後續訓練以進一步挖掘其潛力。

【AiBase提要:】

🌟 全球首個開源的萬億參數推理大模型 Ring-1T-preview 發佈。

🚀 在 AIME25 和 CodeForces 測試中表現優異,接近 GPT-5 的水平。

🧠 團隊正在對模型進行後訓練,以提升其自然語言推理能力。

10、DeepMind 重磅推出 “幀鏈” 概念:視頻模型或將實現全面視覺理解

DeepMind 提出的 '幀鏈'(CoF)概念,爲視頻生成模型帶來了突破性進展。該技術使視頻模型能夠在時間和空間上進行推理,展現出類似語言模型的通用能力。Veo3模型在多個視覺任務中表現出色,顯示出強大的感知、建模和操控能力。

image.png

【AiBase提要:】

🎥 幀鏈技術讓視頻模型具備了跨時空推理能力,提升了視頻生成的智能水平。

🧠 Veo3模型展示了強大的通用視覺能力,能夠處理多種未訓練的任務。

🚀 DeepMind 預測未來通用視頻模型可能取代專用模型,推動機器視覺的新時代。

詳情鏈接:https://papers-pdfs.assets.alphaxiv.org/2509.20328v1.pdf

11、智譜發佈開源大模型GLM-4.6:編程能力對齊Claude Sonnet4

智譜AI發佈了新一代開源大模型GLM-4.6,其在Agentic Coding等關鍵能力上實現大幅提升,編程能力已對齊國際頂尖模型Claude Sonnet4,並超越DeepSeek-V3.2-Exp,成爲國內最強代碼生成模型。同時,GLM-4. 6 在國產化適配方面取得里程碑式進展,成功部署於寒武紀國產芯片和摩爾線程GPU,爲構建自主可控的AI生態系統奠定了基礎。


QQ20250930-155331.png

【AiBase提要:】

✨ GLM-4. 6 在編程能力上達到國際頂尖水平,對齊Claude Sonnet4。

🚀 成功在寒武紀國產芯片上實現FP8+Int4 混合量化部署,推動國產硬件發展。

🔧 基於vLLM框架,在摩爾線程GPU上以原生FP8 精度穩定運行,提升AI生態自主性。