AI日报：字节发布Seed Prover1.5；MiniMax M2.1开源；通义开源语音交互大模型Fun-Audio-Chat-8B

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、字节跳动发布 Seed Prover1.5:推动形式化数学推理的新进展

字节跳动Seed团队推出的Seed Prover1.5在形式化数学推理领域取得重要突破，其通过Agentic强化学习显著提升了推理能力和效率。该模型在IMO2025和普特南数学竞赛中表现出色，展示了强大的性能。

【AiBase提要:】
🌱 Seed Prover1.5采用全新的Agentic Prover架构，结合自然语言推理与形式化证明优势。
💡 模型能够灵活调用Mathlib数学库和Python代码辅助验证，提升复杂问题的解决能力。
🚀 在IMO2025和普特南数学竞赛中，Seed Prover1.5展现了卓越的性能，获得银牌和金牌标准成绩。
详情链接:https://arxiv.org/abs/2512.17260

2、阿里通义开源语音交互大模型Fun-Audio-Chat-8B！超低延迟，能读懂情绪

阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B，这款模型以超低延迟、自然流畅的语音交互为核心，标志着开源语音AI进入全新阶段。它不仅能实时理解用户语音，还具备强大情感感知能力，性能直逼闭源巨头GPT-4o Audio和Gemini2.5Pro。

【AiBase提要:】
🧠 超低延迟与高效设计:采用创新双分辨率架构，GPU计算资源节省近50%，响应速度大幅提升。
😊 富有同理心的情感理解:模型能从语气、语速、停顿等细节感知用户情绪，给出贴心、共情的回应。
🛠 强大语音函数调用:支持Voice Function Calling，用户通过自然语音指令即可执行复杂任务。
详情链接:https://funaudiollm.github.io/funaudiochat/

3、MiniMax M2.1震撼开源！100亿激活参数编码模型登顶SOTA，多语言编程全面超越Gemini3Pro与Claude 4.5

MiniMax M2.1开源大模型在多语言编程和真实工程任务中表现出色，超越了谷歌Gemini3Pro和Anthropic Claude4.5Sonnet等闭源模型，标志着开源编码模型进入性能碾压闭源的新阶段。

【AiBase提要:】
🧠 多语言编程SOTA: M2.1在Python、JavaScript、Java等主流语言中达到开源模型最高水平。
⚙️ 真实工程任务更强: 在SWE-Multilingual中，M2.1的代码修复准确率与端到端任务完成率显著优于Gemini3Pro与Claude4.5Sonnet。
🧩 智能体协作优化: M2.1在工具调用、API集成等Agent核心能力上表现优异，为构建高可靠AI开发者代理提供强大基座。
详情链接:https://www.minimax.io/news/minimax-m21

4、知乎2025年度 AI 产品榜单揭晓，豆包位居榜首

知乎发布了2025年度AI产品榜单，豆包位居榜首，DeepSeek、Gemini和通义千问紧随其后，知乎直答也进入前五名，显示了用户对AI产品的认可与期待。

【AiBase提要:】
🧠 豆包在知乎2025年度AI产品榜单中位居榜首，展现了其强大的市场竞争力。
🤖 DeepSeek、Gemini和通义千问紧随其后，显示出这些产品的受欢迎程度与实用性。
🌐 知乎直答进入前五名，表明用户对平台AI应用的认可与期待。

5、Anthropic 推出全新开源 Agent Skills 知识库，助力 Claude 模型技能拓展

Anthropic 推出全新开源 Agent Skills 知识库，为 Claude 模型的技能系统提供实用的示范性技能和最佳实践，帮助开发者更好地利用该模型进行各类应用。知识库中包含16个公开示例技能，涵盖文档处理、创意设计、开发技术和企业沟通等多个领域。开发者可以通过 Claude Code 的插件市场或在 Claude.ai（付费用户）中直接使用这些技能，同时还可以根据提供的规范和模板创建自定义技能。Agent Skills 的功能使得用户能够通过可打包、可复用的文件夹形式来定义一系列指令集，这些文件夹中包含 Markdown 说明文件、脚本和其他资源，以指导模型高效地完成特定任务。这一功能现已向所有付费用户开放，支持 Claude.ai、Claude Code 及其 API。

【AiBase提要:】
🌟 Anthropic 开源了 Agent Skills 知识库，包含16个示范技能，覆盖多个领域。
🛠️ 开发者可以直接使用或自定义技能，提升 Claude 模型的应用能力。
⚙️ Skills 功能实现按需加载，降低 Token 消耗，提升效率。
详情链接:https://github.com/anthropics/skills

6、Lima v2.0 重磅发布：从容器利器进化为安全 AI 工作流的“隐形盾牌”

Lima v2.0的发布标志着其从容器工具向AI工作流安全防护的重要转型，通过创新的虚拟化隔离技术，为开发者提供了更高效且安全的AI开发环境。

【AiBase提要:】
🛡️ Lima v2.0为AI开发构建了坚实的“沙箱”机制，防止AI代理访问主机敏感文件或执行高风险命令。
⚙️ 新版本引入实验性插件架构和GPU加速功能，提升性能与扩展性。
🔒 集成模型上下文协议(MCP)工具，提供更安全的本地文件读写方案。

7、讯飞星火大模型首获国家安全标准认证，AI 安全再上新台阶！

科大讯飞星火大模型成功通过国家安全标准试点验证，标志着其在生成式人工智能安全领域取得重要进展。该模型不仅参与了标准编制工作，还建立了全面的安全防护平台，并研发了新一代隐式水印技术，以提升AI生成内容的可信度和安全性。

【AiBase提要:】
🧠 科大讯飞星火大模型通过国家安全标准验证，成为首批获得《人工智能安全国家标准符合性自评估证书》的单位之一。
🛡️ 星火大模型建立全面的安全防护平台，涵盖数十种技术，提供多语言、多模态场景下的“开箱即用”保护。
🔐 讯飞研发新一代生成式文本隐式水印技术，为AI生成内容提供唯一数字身份识别，提升可信性。

8、 2025 元宝xDeepSeek年度报告：用户提问量涨百倍，AI 成日常刚需

《元宝xDeepSeek年度报告》揭示了AI助手在 2025 年的使用趋势，包括用户深度交互比例、提问量激增以及情感互动的增强。

【AiBase提要:】
🧠 用户深度交互占比达3:7，AI助手在聊天、学习和写作场景中表现突出。
📈12 月 14 日提问量达到全年峰值，较年初增长超 100 倍，显示用户对AI的依赖度显著提升。
🔄 深度用户评价“治愈内耗”“情绪价值”“有活人感”，表明AI助手在情感互动方面取得突破。

AI日报：字节发布Seed Prover1.5；MiniMax M2.1开源；通义开源语音交互大模型Fun-Audio-Chat-8B

相关推荐

15 岁少年利用AI实施勒索攻击，致知名平台全站停服

腾讯混元Hy3发布：Agent能力和产品体验跃升

8 小时追平、 2 天反超：面壁智能 ForgeTrain 如何用 AI“锻造”下一代训练框架？

全球首例AI智能体勒索攻击浮出水面：无需人类干预的自动化“作案”链条

百年超导竞赛迎来AI破局： 28 小时精准筛选，锁定四种全新材料