欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA,多场景赋能 OCR 应用
腾讯混元正式开源全新 OCR 模型 HunyuanOCR,该模型参数仅10亿,依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中取得 SOTA 成绩。其采用全端到端范式设计,具备高效便捷、性能优异等优势,并在多语种文档解析、票据字段提取和视频字幕抽取等方面有广泛应用。

【AiBase提要:】
🔥 HunyuanOCR 是一款轻量级 OCR 模型,参数仅为 10 亿,便于部署和使用。
📊 在 OmniDocBench 测评中,HunyuanOCR 以 94.1 分超越谷歌 Gemini3-Pro 等领先模型。
🌍 支持 14 种高频小语种与中/英文互译,并在 ICDAR2025 端到端文档翻译比赛中获得小模型赛道冠军。
详情链接:https://hunyuan.tencent.com/vision/zh?tabIndex=0 https://github.com/Tencent-Hunyuan/HunyuanOCR
2、豆包输入法正式上线 深度整合AI,支持复杂语境智能预测与离线使用
豆包输入法正式上线,深度整合AI技术,支持复杂语境智能预测与离线使用,为用户提供更高效、便捷的输入体验。

【AiBase提要:】
🗣️ 支持多种方言、英语及中英混合输入,适应嘈杂环境。
⌨️ 利用AI技术提升长句输入准确率,结合语境自动纠错。
🌐 界面整洁无广告,支持离线使用语音输入。
3、Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型
Anthropic 发布了其最新旗舰模型 Claude Opus4.5,该模型在编码、推理和长期任务管理方面表现出色,显著提升了软件工程、多智能体协作以及办公自动化等场景的生产力。同时,Opus4.5在安全性、效率和资源使用灵活性上也有了重大改进。
【AiBase提要:】
🧠 核心能力涵盖编码、推理与长期任务管理,性能达到世界领先水平。
🚀 支持较长上下文窗口,并引入 'effort 参数' 提升计算强度与输出质量。
🔒 安全性增强,对齐性和鲁棒性优于此前版本,更难被误导。
4、ChatGPT“购物研究”上线:利用用户“记忆”深度推荐 准确率高达64%
OpenAI推出了名为‘购物研究’的新功能,使ChatGPT能够根据用户的对话历史进行个性化产品搜索和推荐。该功能在假日购物季期间基本不受限制,并依托于一个专用模型运行,准确率达到64%。

【AiBase提要:】
🛒 购物研究功能通过分析用户的历史对话提供个性化推荐
🔍 该工具能主动提出问题并生成可视化的购物指南
📊 专用模型的准确率高达64%,远超标准模型
5、全球首个“纯AMD”训练MoE大模型ZAYA1 发布:14T tokens+CCA注意力,性能对标Qwen3
文章介绍了AMD与IBM及AI初创公司Zyphra合作推出的全球首个全程基于AMD硬件训练的MoE基础模型ZAYA1。该模型在预训练数据量、性能表现以及架构创新方面均展现出强大的实力,尤其在数学和STEM推理领域表现出色。
【AiBase提要:】
🔥 ZAYA1是全球首个全程基于AMD硬件训练的MoE基础模型,展现了AMD在大规模模型训练中的潜力。
💡 CCA注意力机制显著降低了显存占用并提升了长上下文吞吐能力,体现了架构上的创新。
📈 ZAYA1在多个基准测试中与Qwen3系列表现相当,且在部分任务中超越了Qwen3专业版,显示出其强大的性能。
6、微软推出 Fara-7B:本地运行的计算机智能助手
微软推出的 Fara-7B 是一款拥有70亿参数的本地运行计算机智能助手,专注于数据安全和隐私保护。它通过视觉方式处理网页,与用户交互更加直观,并在任务执行效率上超越了其他大型模型。

【AiBase提要:】
🌟 Fara-7B 是一款本地运行的计算机智能助手,专注于数据安全和隐私保护。
⚙️ 该模型通过视觉方式处理网页,与用户的交互更为直观,效率远超其他大型模型。
🛡️ Fara-7B 具备 “关键点” 识别功能,确保用户在关键操作前能进行确认,提升安全性。
7、谷歌Nano Bana Pro模型首秀:NotebookLM新增幻灯片和信息图功能
谷歌在其AI笔记工具NotebookLM中新增了幻灯片生成器功能,使用户能够快速将笔记或资料转换为简洁的演示幻灯片。这一新工具基于谷歌的Nano Bana Pro模型(即Gemini3Pro图像生成),旨在提升用户的整理效率和视觉效果。
【AiBase提要:】
✨ 新增幻灯片生成器功能,帮助用户高效整理笔记并生成演示草稿。
🖼️ 基于Nano Bana Pro模型,支持将详细提示转化为精确且包含大量文字的图像。
📄 目前可导出为PDF格式,未来计划支持Google Slides和PowerPoint格式。
8、Amazon Leo正式开放企业测试:1Gbps卫星直连AWS, 2025 年底启动、 2026 年全面商用
Amazon Leo的推出标志着亚马逊在低轨卫星网络领域的重大进展。其提供三种终端设备,支持高速数据传输,并通过AWS骨干网实现安全连接,强调‘卫星+云+AI’一体化模式,旨在满足工业级和偏远地区的通信需求。
【AiBase提要:】
🛰️ Amazon Leo提供三种终端设备,分别适用于工业级场景、偏远办公及轻量级应用。
🔒 终端具备军规级设计与AES-256加密,确保在极端环境下稳定运行并保障数据安全。
🌐 每颗卫星作为AWS边缘节点,客户可直接调用云服务,形成差异化竞争力。
