AI日報：字節發佈Seed Prover1.5；MiniMax M2.1開源；通義開源語音交互大模型Fun-Audio-Chat-8B

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、字節跳動發佈 Seed Prover1.5:推動形式化數學推理的新進展

字節跳動Seed團隊推出的Seed Prover1.5在形式化數學推理領域取得重要突破，其通過Agentic強化學習顯著提升了推理能力和效率。該模型在IMO2025和普特南數學競賽中表現出色，展示了強大的性能。

【AiBase提要:】
🌱 Seed Prover1.5採用全新的Agentic Prover架構，結合自然語言推理與形式化證明優勢。
💡 模型能夠靈活調用Mathlib數學庫和Python代碼輔助驗證，提升複雜問題的解決能力。
🚀 在IMO2025和普特南數學競賽中，Seed Prover1.5展現了卓越的性能，獲得銀牌和金牌標準成績。
詳情鏈接:https://arxiv.org/abs/2512.17260

2、阿里通義開源語音交互大模型Fun-Audio-Chat-8B！超低延遲，能讀懂情緒

阿里巴巴通義實驗室正式開源新一代端到端語音交互大模型Fun-Audio-Chat-8B，這款模型以超低延遲、自然流暢的語音交互爲核心，標誌着開源語音AI進入全新階段。它不僅能實時理解用戶語音，還具備強大情感感知能力，性能直逼閉源巨頭GPT-4o Audio和Gemini2.5Pro。

【AiBase提要:】
🧠 超低延遲與高效設計:採用創新雙分辨率架構，GPU計算資源節省近50%，響應速度大幅提升。
😊 富有同理心的情感理解:模型能從語氣、語速、停頓等細節感知用戶情緒，給出貼心、共情的迴應。
🛠 強大語音函數調用:支持Voice Function Calling，用戶通過自然語音指令即可執行復雜任務。
詳情鏈接:https://funaudiollm.github.io/funaudiochat/

3、MiniMax M2.1震撼開源！100億激活參數編碼模型登頂SOTA，多語言編程全面超越Gemini3Pro與Claude 4.5

MiniMax M2.1開源大模型在多語言編程和真實工程任務中表現出色，超越了谷歌Gemini3Pro和Anthropic Claude4.5Sonnet等閉源模型，標誌着開源編碼模型進入性能碾壓閉源的新階段。

【AiBase提要:】
🧠 多語言編程SOTA: M2.1在Python、JavaScript、Java等主流語言中達到開源模型最高水平。
⚙️ 真實工程任務更強: 在SWE-Multilingual中，M2.1的代碼修復準確率與端到端任務完成率顯著優於Gemini3Pro與Claude4.5Sonnet。
🧩 智能體協作優化: M2.1在工具調用、API集成等Agent核心能力上表現優異，爲構建高可靠AI開發者代理提供強大基座。
詳情鏈接:https://www.minimax.io/news/minimax-m21

4、知乎2025年度 AI 產品榜單揭曉，豆包位居榜首

知乎發佈了2025年度AI產品榜單，豆包位居榜首，DeepSeek、Gemini和通義千問緊隨其後，知乎直答也進入前五名，顯示了用戶對AI產品的認可與期待。

【AiBase提要:】
🧠 豆包在知乎2025年度AI產品榜單中位居榜首，展現了其強大的市場競爭力。
🤖 DeepSeek、Gemini和通義千問緊隨其後，顯示出這些產品的受歡迎程度與實用性。
🌐 知乎直答進入前五名，表明用戶對平臺AI應用的認可與期待。

5、Anthropic 推出全新開源 Agent Skills 知識庫，助力 Claude 模型技能拓展

Anthropic 推出全新開源 Agent Skills 知識庫，爲 Claude 模型的技能系統提供實用的示範性技能和最佳實踐，幫助開發者更好地利用該模型進行各類應用。知識庫中包含16個公開示例技能，涵蓋文檔處理、創意設計、開發技術和企業溝通等多個領域。開發者可以通過 Claude Code 的插件市場或在 Claude.ai（付費用戶）中直接使用這些技能，同時還可以根據提供的規範和模板創建自定義技能。Agent Skills 的功能使得用戶能夠通過可打包、可複用的文件夾形式來定義一系列指令集，這些文件夾中包含 Markdown 說明文件、腳本和其他資源，以指導模型高效地完成特定任務。這一功能現已向所有付費用戶開放，支持 Claude.ai、Claude Code 及其 API。

【AiBase提要:】
🌟 Anthropic 開源了 Agent Skills 知識庫，包含16個示範技能，覆蓋多個領域。
🛠️ 開發者可以直接使用或自定義技能，提升 Claude 模型的應用能力。
⚙️ Skills 功能實現按需加載，降低 Token 消耗，提升效率。
詳情鏈接:https://github.com/anthropics/skills

6、Lima v2.0 重磅發佈：從容器利器進化爲安全 AI 工作流的“隱形盾牌”

Lima v2.0的發佈標誌着其從容器工具向AI工作流安全防護的重要轉型，通過創新的虛擬化隔離技術，爲開發者提供了更高效且安全的AI開發環境。

【AiBase提要:】
🛡️ Lima v2.0爲AI開發構建了堅實的“沙箱”機制，防止AI代理訪問主機敏感文件或執行高風險命令。
⚙️ 新版本引入實驗性插件架構和GPU加速功能，提升性能與擴展性。
🔒 集成模型上下文協議(MCP)工具，提供更安全的本地文件讀寫方案。

7、訊飛星火大模型首獲國家安全標準認證，AI 安全再上新臺階！

科大訊飛星火大模型成功通過國家安全標準試點驗證，標誌着其在生成式人工智能安全領域取得重要進展。該模型不僅參與了標準編制工作，還建立了全面的安全防護平臺，並研發了新一代隱式水印技術，以提升AI生成內容的可信度和安全性。

【AiBase提要:】
🧠 科大訊飛星火大模型通過國家安全標準驗證，成爲首批獲得《人工智能安全國家標準符合性自評估證書》的單位之一。
🛡️ 星火大模型建立全面的安全防護平臺，涵蓋數十種技術，提供多語言、多模態場景下的“開箱即用”保護。
🔐 訊飛研發新一代生成式文本隱式水印技術，爲AI生成內容提供唯一數字身份識別，提升可信性。

8、 2025 元寶xDeepSeek年度報告：用戶提問量漲百倍，AI 成日常剛需

《元寶xDeepSeek年度報告》揭示了AI助手在 2025 年的使用趨勢，包括用戶深度交互比例、提問量激增以及情感互動的增強。

【AiBase提要:】
🧠 用戶深度交互佔比達3:7，AI助手在聊天、學習和寫作場景中表現突出。
📈12 月 14 日提問量達到全年峯值，較年初增長超 100 倍，顯示用戶對AI的依賴度顯著提升。
🔄 深度用戶評價“治癒內耗”“情緒價值”“有活人感”，表明AI助手在情感互動方面取得突破。

AI日報：字節發佈Seed Prover1.5；MiniMax M2.1開源；通義開源語音交互大模型Fun-Audio-Chat-8B

相關推薦

讓機器人學會番茄炒蛋的“幕後推手”：Genesis AI 開源全棧訓練場

字節豆包 AI 手機項目生變：硬件負責人離職，項目進入“調整期”

AI 智能體 Elements Claw 成功“閉環”超導材料研發

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單