歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、豆包大模型1.6-vision正式發佈,對比上一代綜合成本降低約50%
豆包大模型1.6-vision的發佈標誌着其在多模態理解和推理能力上的重大突破,同時通過引入工具調用功能和優化性能,顯著提升了開發效率和性價比。

【AiBase提要:】
🧠 調用工具,視覺理解更精準。
💻 應用開發更高效。
💰 更高模型性價比。
2、通義千問發佈Qwen3-LiveTranslate-Flash3 秒同傳延遲刷新行業紀錄
通義千問推出的Qwen3-LiveTranslate-Flash系統,實現了多語言實時音視頻翻譯的突破。該系統支持 18 種語言及多種方言,並通過視覺上下文增強技術提升翻譯準確性,同時實現最低 3 秒的同傳延遲,顯著優於其他主流模型。

【AiBase提要:】
🌍 支持 18 種語言及多種方言,覆蓋廣泛的語言需求。
🧠 引入視覺上下文增強技術,提升複雜語境下的翻譯準確率。
⏱️ 實現最低 3 秒同傳延遲,大幅提升實時翻譯流暢性。
3、DeepSeek發佈V3.2-exp模型,開創性稀疏注意力機制 將API 成本降低一半
DeepSeek發佈了名爲V3.2-exp的新實驗模型,通過創新的‘稀疏注意力’機制顯著降低了長上下文操作的推理成本。該模型結合了‘閃電索引器’和‘細粒度標記選擇系統’,提高了處理長上下文片段的效率,並在初步測試中展示了API調用成本降低50%的優勢。

【AiBase提要:】
⚡ DeepSeek推出V3.2-exp模型,採用稀疏注意力機制優化長上下文處理。
🔍 閃電索引器與細粒度標記選擇系統協同提升模型效率。
💰 初步測試顯示API調用成本降低達50%,爲AI應用提供更經濟的解決方案。
4、Anthropic放大招!Claude Sonnet4.5碾壓GPT-5,編碼界“新王者”誕生
Anthropic發佈了Claude Sonnet4.5模型,該模型在編碼任務和複雜任務處理上表現出色,成爲當前最優秀的編碼模型之一。其性能提升顯著,支持多平臺使用,並且在安全性和對齊性方面也有所增強。

【AiBase提要:】
✅ Claude Sonnet4.5在編碼基準測試中表現優異,實現30小時以上的自主工作時長。
🔧 新增功能如檢查點、上下文編輯和內存工具,提升了開發效率與實用性。
🔒 強調安全性,降低風險行爲,適用於高風險企業場景。
5、ChatGPT 聊天即買!AI 革命電商:一鍵下單,告別瀏覽器跳轉
ChatGPT 推出‘即時結賬’功能,用戶可在聊天界面直接完成單件商品購買,無需跳轉鏈接或瀏覽器。該功能由 OpenAI 與 Stripe 合作開發的‘代理商務協議’驅動,支持多種支付方式,並將擴展至多件購物車和國際市場。
【AiBase提要:】
💡 ChatGPT 推出‘即時結賬’功能,實現聊天界面直接下單。
🔒 ‘代理商務協議’確保交易安全、簡易且兼容多種支付方式。
🌐 未來將擴展至多件購物車和國際市場,提升用戶體驗。
6、OpenAI 即將推出AI版TikTok,全網視頻內容將由AI創造
OpenAI即將推出一款基於Sora2模型的社交應用,名爲‘AI版TikTok’,所有內容均由AI生成。該應用設計類似TikTok,但視頻時長限制爲10秒,且支持用戶身份認證和肖像使用。此外,OpenAI還注重安全與版權問題,以提升用戶體驗和防止用戶流失。
【AiBase提要:】
🎥 Sora2模型生成的視頻時長限制爲10秒,專注於短小精悍的內容傳播。
🔒 用戶可認證身份,Sora2可使用其肖像進行視頻生成,並允許其他用戶標記使用。
🛡️ OpenAI將發送提醒,確保用戶在使用肖像時知情,同時處理版權問題。
7、Claude Code 2.0震撼升級:檢查點+VS Code插件,編程效率飆升3倍
Anthropic發佈了Claude Code v2.0和Claude Sonnet4.5模型的更新,顯著提升了AI在編程中的自主性和集成性。Claude Code通過檢查點機制、終端與IDE的優化以及API擴展,爲開發者提供了更高效的編程體驗。

【AiBase提要:】
✅ Claude Code v2.0引入了檢查點功能,使AI能自動保存狀態並支持回滾,提升開發安全性。
🔧 VS Code原生擴展進入beta測試階段,提供內聯差異預覽和圖形化交互,提高協作效率。
📈 Sonnet4.5模型在OSWorld基準測試中得分高達61.4%,表現出色,尤其擅長構建複雜代理系統。
8、百度地圖升級小度想想 2.0:出行智能助手全面進化
百度地圖在第七屆世界新能源汽車大會上發佈了小度想想 2.0,這一版本作爲行業首個深度融合的端到端語音語言大模型,爲用戶提供更智能、個性化的出行服務。其核心優勢包括:引入地圖出行知識庫和實時搜索數據以提升複雜出行意圖的理解;構建跨端記憶體以實現多設備間的無縫銜接;以及具備即時、近期及長期記憶能力,從而提供個性化的推薦服務。
【AiBase提要:】
🚗 百度地圖引入地圖出行知識庫和實時搜索數據,提升複雜出行意圖的理解與推理能力。
📱 跨端記憶體實現手機、車機等多場景無縫銜接,提升用戶體驗。
🧠 智能助手具備即時、近期及長期記憶能力,提供個性化推薦服務。
9、螞蟻集團開源全球首個萬億參數大模型 Ring-1T-preview
螞蟻集團推出的Ring-1T-preview是全球首個開源的萬億參數推理大模型,在多項測試中表現優異,超越了多個已知開源模型,接近GPT-5。該模型在自然語言推理和代碼生成方面展現出強大的能力,並且團隊正在對其進行後續訓練以進一步挖掘其潛力。
【AiBase提要:】
🌟 全球首個開源的萬億參數推理大模型 Ring-1T-preview 發佈。
🚀 在 AIME25 和 CodeForces 測試中表現優異,接近 GPT-5 的水平。
🧠 團隊正在對模型進行後訓練,以提升其自然語言推理能力。
10、DeepMind 重磅推出 “幀鏈” 概念:視頻模型或將實現全面視覺理解
DeepMind 提出的 '幀鏈'(CoF)概念,爲視頻生成模型帶來了突破性進展。該技術使視頻模型能夠在時間和空間上進行推理,展現出類似語言模型的通用能力。Veo3模型在多個視覺任務中表現出色,顯示出強大的感知、建模和操控能力。

【AiBase提要:】
🎥 幀鏈技術讓視頻模型具備了跨時空推理能力,提升了視頻生成的智能水平。
🧠 Veo3模型展示了強大的通用視覺能力,能夠處理多種未訓練的任務。
🚀 DeepMind 預測未來通用視頻模型可能取代專用模型,推動機器視覺的新時代。
詳情鏈接:https://papers-pdfs.assets.alphaxiv.org/2509.20328v1.pdf
11、智譜發佈開源大模型GLM-4.6:編程能力對齊Claude Sonnet4
智譜AI發佈了新一代開源大模型GLM-4.6,其在Agentic Coding等關鍵能力上實現大幅提升,編程能力已對齊國際頂尖模型Claude Sonnet4,並超越DeepSeek-V3.2-Exp,成爲國內最強代碼生成模型。同時,GLM-4. 6 在國產化適配方面取得里程碑式進展,成功部署於寒武紀國產芯片和摩爾線程GPU,爲構建自主可控的AI生態系統奠定了基礎。

【AiBase提要:】
✨ GLM-4. 6 在編程能力上達到國際頂尖水平,對齊Claude Sonnet4。
🚀 成功在寒武紀國產芯片上實現FP8+Int4 混合量化部署,推動國產硬件發展。
🔧 基於vLLM框架,在摩爾線程GPU上以原生FP8 精度穩定運行,提升AI生態自主性。
