欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA,多场景赋能 OCR 应用

腾讯混元正式开源全新 OCR 模型 HunyuanOCR,该模型参数仅10亿,依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中取得 SOTA 成绩。其采用全端到端范式设计,具备高效便捷、性能优异等优势,并在多语种文档解析、票据字段提取和视频字幕抽取等方面有广泛应用。

image.png

【AiBase提要:】

🔥 HunyuanOCR 是一款轻量级 OCR 模型,参数仅为 10 亿,便于部署和使用。

📊 在 OmniDocBench 测评中,HunyuanOCR 以 94.1 分超越谷歌 Gemini3-Pro 等领先模型。

🌍 支持 14 种高频小语种与中/英文互译,并在 ICDAR2025 端到端文档翻译比赛中获得小模型赛道冠军。

详情链接:https://hunyuan.tencent.com/vision/zh?tabIndex=0 https://github.com/Tencent-Hunyuan/HunyuanOCR

2、豆包输入法正式上线 深度整合AI,支持复杂语境智能预测与离线使用

豆包输入法正式上线,深度整合AI技术,支持复杂语境智能预测与离线使用,为用户提供更高效、便捷的输入体验。

image.png

【AiBase提要:】

🗣️ 支持多种方言、英语及中英混合输入,适应嘈杂环境。

⌨️ 利用AI技术提升长句输入准确率,结合语境自动纠错。

🌐 界面整洁无广告,支持离线使用语音输入。

3、Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型

Anthropic 发布了其最新旗舰模型 Claude Opus4.5,该模型在编码、推理和长期任务管理方面表现出色,显著提升了软件工程、多智能体协作以及办公自动化等场景的生产力。同时,Opus4.5在安全性、效率和资源使用灵活性上也有了重大改进。

【AiBase提要:】

🧠 核心能力涵盖编码、推理与长期任务管理,性能达到世界领先水平。

🚀 支持较长上下文窗口,并引入 'effort 参数' 提升计算强度与输出质量。

🔒 安全性增强,对齐性和鲁棒性优于此前版本,更难被误导。

4、ChatGPT“购物研究”上线:利用用户“记忆”深度推荐 准确率高达64%

OpenAI推出了名为‘购物研究’的新功能,使ChatGPT能够根据用户的对话历史进行个性化产品搜索和推荐。该功能在假日购物季期间基本不受限制,并依托于一个专用模型运行,准确率达到64%。

image.png

【AiBase提要:】

🛒 购物研究功能通过分析用户的历史对话提供个性化推荐

🔍 该工具能主动提出问题并生成可视化的购物指南

📊 专用模型的准确率高达64%,远超标准模型

5、全球首个“纯AMD”训练MoE大模型ZAYA1 发布:14T tokens+CCA注意力,性能对标Qwen3

文章介绍了AMD与IBM及AI初创公司Zyphra合作推出的全球首个全程基于AMD硬件训练的MoE基础模型ZAYA1。该模型在预训练数据量、性能表现以及架构创新方面均展现出强大的实力,尤其在数学和STEM推理领域表现出色。

【AiBase提要:】

🔥 ZAYA1是全球首个全程基于AMD硬件训练的MoE基础模型,展现了AMD在大规模模型训练中的潜力。

💡 CCA注意力机制显著降低了显存占用并提升了长上下文吞吐能力,体现了架构上的创新。

📈 ZAYA1在多个基准测试中与Qwen3系列表现相当,且在部分任务中超越了Qwen3专业版,显示出其强大的性能。

6、微软推出 Fara-7B:本地运行的计算机智能助手

微软推出的 Fara-7B 是一款拥有70亿参数的本地运行计算机智能助手,专注于数据安全和隐私保护。它通过视觉方式处理网页,与用户交互更加直观,并在任务执行效率上超越了其他大型模型。

image.png

【AiBase提要:】

🌟 Fara-7B 是一款本地运行的计算机智能助手,专注于数据安全和隐私保护。

⚙️ 该模型通过视觉方式处理网页,与用户的交互更为直观,效率远超其他大型模型。

🛡️ Fara-7B 具备 “关键点” 识别功能,确保用户在关键操作前能进行确认,提升安全性。

7、谷歌Nano Bana Pro模型首秀:NotebookLM新增幻灯片和信息图功能

谷歌在其AI笔记工具NotebookLM中新增了幻灯片生成器功能,使用户能够快速将笔记或资料转换为简洁的演示幻灯片。这一新工具基于谷歌的Nano Bana Pro模型(即Gemini3Pro图像生成),旨在提升用户的整理效率和视觉效果。

【AiBase提要:】

✨ 新增幻灯片生成器功能,帮助用户高效整理笔记并生成演示草稿。

🖼️ 基于Nano Bana Pro模型,支持将详细提示转化为精确且包含大量文字的图像。

📄 目前可导出为PDF格式,未来计划支持Google Slides和PowerPoint格式。

8、Amazon Leo正式开放企业测试:1Gbps卫星直连AWS, 2025 年底启动、 2026 年全面商用

Amazon Leo的推出标志着亚马逊在低轨卫星网络领域的重大进展。其提供三种终端设备,支持高速数据传输,并通过AWS骨干网实现安全连接,强调‘卫星+云+AI’一体化模式,旨在满足工业级和偏远地区的通信需求。

【AiBase提要:】

🛰️ Amazon Leo提供三种终端设备,分别适用于工业级场景、偏远办公及轻量级应用。

🔒 终端具备军规级设计与AES-256加密,确保在极端环境下稳定运行并保障数据安全。

🌐 每颗卫星作为AWS边缘节点,客户可直接调用云服务,形成差异化竞争力。