欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、DeepSeek 开启识图模式灰度测试,多模态视觉理解能力正式落地
DeepSeek 在发布 DeepSeek-V4 后迅速开启多模态识图功能的灰度测试,标志着其多模态能力进入实质性阶段。该功能在移动端与网页版新增了“识图模式”入口,并在基础视觉理解、画面描述及逻辑推理方面表现出色,但仍有优化空间。

【AiBase提要:】
✨ DeepSeek 开启多模态识图功能灰度测试,推动视觉交互发展。
🔍 模型在基础视觉理解与逻辑推理方面表现优异,具备较高还原度。
⚠️ 面对极端视觉挑战时识别率受限,需进一步优化提升准确率。
2、文心一言5.1预览版上线 LMSYS 竞技场,目前位列全球第13位
文心一言5.1预览版低调上线国际大模型盲测平台LMSYS Chatbot Arena,位列全球第13位。这标志着百度核心模型进入新一轮快速迭代周期,并开始接受全球用户的直接质量检验与基准对标。
【AiBase提要:】
🚀 文心一言5.1预览版低调上线国际大模型盲测平台LMSYS Chatbot Arena。
📊 该版本在总榜中位列第13位,展现强大的技术实力。
🌐 百度通过公开的国际主流评价体系验证其实战能力,加速全球化布局。
3、小红书成立 AI 一级部门 “Dots”
小红书宣布成立AI一级部门“Dots”和企业智能部,以增强对人工智能的技术投入,并设立海外部门“Rednote”和Lab 1327团队,推动国际化业务和新产品孵化。
【AiBase提要:】
✅ 设立AI一级部门“Dots”,涵盖AI模型研发、基础设施、工程落地和产品应用等多个环节。
✅ 企业智能部整合原有企业效率部和数据科学部,为AI时代发展提供组织架构和人才支撑。
✅ 成立海外部门“Rednote”和Lab 1327团队,推动国际化业务和新产品孵化。
4、Chrome 正式发布 Prompt API:浏览器原生 AI 时代来临,网页直接调用 Gemini Nano 本地模型
Chrome 推出 Prompt API,允许开发者通过 JavaScript 直接调用内置的 Gemini Nano 模型,实现本地 AI 能力。这一功能标志着浏览器 AI 能力的“民主化”,提升了隐私保护并降低了开发门槛。

【AiBase提要:】
🌍 Prompt API 是 Chrome 内置 AI 框架的一部分,允许网页应用调用 Gemini Nano 模型。
🔒 模型在本地运行,数据不上传云端,提升隐私保护。
🛠️ 开发者无需依赖外部 API,降低开发成本和复杂性。
详情链接:https://developer.chrome.com/docs/ai/prompt-api
5、程序员“数字分身”上岗:阿里发布 QoderWake,实现代码修复全流程无人值守
阿里巴巴发布QoderWake和Qoder移动端,标志着其AI智能体生态实现全场景覆盖,提升了研发运维自动化水平,并推动AI向原生操作系统级转型。

【AiBase提要:】
💻 QoderWake作为生产级数字员工,能够自主执行代码变更简报整理、错误诊断等任务并生成修复代码。
📱 Qoder移动端支持跨端协同与交互体验革新,用户可通过手机远程操控桌面端Agent执行复杂任务。
🔄 阿里通过Qoder产品布局,推动AI从辅助工具演变为具备独立任务处理能力的生产要素。
详情链接:https://qoder.com/qoderwake
6、蚂蚁集团正式开源万亿级大模型Ling-2.6-1T
蚂蚁集团正式开源万亿级大模型Ling-2.6-1T,该模型通过创新的混合架构优化了指令执行、工具适配及长上下文承接能力,提升了智效比。同时,它能够适配多工具、多约束的复杂业务场景,展现出强大的多步执行能力,在代码生成、缺陷修复以及噪声环境下的精准推理方面均达到了开源领域的顶尖水平。

【AiBase提要:】
🧠 Ling-2.6-1T采用混合架构,提升智效比
🛠️ 支持多工具、多约束的复杂业务场景
🚀 在代码生成和精准推理方面达到开源领域顶尖水平
详情链接:https://huggingface.co/inclusionAI/Ling-2.6-1T
7、巨日禄宣布与火山引擎达成深度合作 AI短剧进入“工业化”时代
杭州巨日禄科技有限公司与火山引擎达成深度合作,接入豆包视频生成模型Seedance 2.0,标志着AI剧制作进入工业化时代。通过整合火山引擎的算力与算法优势,巨日禄实现了制作效率和画面可用性的双重突破,并构建了全栈式技术架构,推动国内AI影视产业向更成熟的工业化阶段迈进。
【AiBase提要:】
🚀 效率与质量的双重飞跃:AI剧制作效率提升近10倍,生产周期从15-30天压缩至1-3天。
🖼️ 画面可用性显著提升:传统AI生成模式下画面合格率仅30%,新技术架构下已跃升至90%以上。
🛠️ 全栈式技术架构:双方合作构建覆盖前期创作到最终交付的技术体系,降低AI剧生产门槛并确保内容高品质。
8、彻底告别复制粘贴!Gemini 迎来史诗级更新,一键生成 Office 文档
Gemini通过新增直接生成和导出多种格式文件的功能,显著提升了其作为生产力工具的能力,同时增强了与办公软件的衔接性,为用户提供了更高效的办公体验。
【AiBase提要:】
✨Gemini新增直接生成并导出多种格式文件的功能,提升办公效率。
📊支持Google Docs、Word、Excel等主流文档格式,兼容性强。
🖼️引入图像识别功能,可将手写笔记转为排版规整的PDF文件。
