腾讯发布 HunyuanOCR 开源模型，参数仅 1B 成就多项 SOTA 表现

近日，腾讯正式推出其全新开源模型 HunyuanOCR，参数量仅为1B。该模型基于腾讯独创的混元多模态架构设计，已在多个行业标准的 OCR 应用中取得了 SOTA（最先进水平）的佳绩。腾讯方面表示，HunyuanOCR 的 “端到端” 设计理念使得模型的各项功能在一次前向推理中便可快速获得最优结果。

HunyuanOCR 主要由三大核心组件构成:原生分辨率视频编码器、自适应视觉适配轻量化混元语言模型。与市面上其他 OCR 模型不同的是，Hunyuan 采用了全端到端的训练和推理方式，并通过规模的应用导向数据以及在线强化学习，展现了出色的推理能力。

在复杂文档解析的测试中 HunyuanOCR 以94.1的高分超越了包括谷歌 Gemini3-pro 在内的多个领先模型。其文字检测和识别能力也非常出，涵盖了文档、艺术字、街景、手写、广告、票据等多种应用场景，相较于其他开源及商业 OCR 模型表现优异，在 OCR 中，该模型的总得分高达860分，成为总参数3B 以下的模型中的佼佼者。

HunyuanOCR 还支持14种语种的翻功能，在翻译领域，表现出。该模型对多复杂文档电子化处理，将扫描件拍摄图中的文本按照阅读顺序组织，并能够使用 LaTe 格式表示公式 HTML 格式复杂表格。

应用方面，HunyOCR 适合进行语种文档解析、票据字段抽取视频字幕识别及拍照翻译等任务，展示了广泛的应用潜力。

github:https://github.com/Tencent-Hunyuan/HunyuanOCR

划重点:
🔍 HunyuanOCR 模型1B，通过端到端设计实现多项 SOTA 成果。
📄该模型支持复杂文档解析、文字检测及识别，覆盖多种应用场景。
🌐 HunyuanOCR 还具备14小语种翻译能力，特别适用于拍照翻译功能。

QQ宠物携AI大脑重生：接入腾讯Hy3 大模型，这次真的会"回应"你

腾讯今日宣布QQ宠物以全新形态回归，形象升级为毛茸茸3D，搭载自研混元Hy3大模型，实现主动互动。经典喂食、洗澡、打工玩法延续并进阶，玩家可定制外形与性格，如戏精或粘人型，每只宠物脾气各异。这一融合AI的虚拟伙伴承载青春回忆，将以更智能、更个性的方式陪伴用户。

解锁“碰一碰”分享！腾讯 WorkBuddy 首发上架鸿蒙 PC 应用市场

腾讯办公智能体WorkBuddy正式上架鸿蒙电脑应用市场，成为鸿蒙生态首个桌面办公智能体。团队联合鸿蒙专家攻克登录、连接等核心场景，完成系统级权限适配，并依托鸿蒙底层能力上线其他主流系统暂未实现的“碰一碰”分享功能。该工具原生植入AI能力，旨在提升桌面办公体验。

腾讯混元"合二为一"：多模态与大语言模型部门合并，姚顺雨统管冲全模态上限

据7月24日报道，腾讯于7月23日宣布将混元多模态模型部门与大语言模型部门合并，组建基础模型部，由首席AI科学家姚顺雨统率。此举旨在提升研发与协同效率，全力冲刺全模态模型的智能上限。整合早有伏笔，去年12月姚顺雨已接管大语言模型团队，如今双边归一，意味着腾讯集中资源推动多模态与语言深度融合，加速构建新一代统一基础模型，向全模态智能更高峰迈进。

腾讯甩出 WorkBuddy Bench：一套把代码、网页、办公、安全全装进来的编码智能体考场

腾讯推出WorkBuddy Bench多领域评测套件，论文已发布于arXiv。它打破编码智能体评测各自为政、生产基准不透明的局面，将仓库级代码工程、前端制品、办公自动化等四类工作场景整合为一。最大亮点不在题量，而是从题目根源设计上杜绝“背答案”，确保评测能真实反映智能体在不同领域的通用与迁移能力。

腾讯发布 HunyuanOCR 开源模型，参数仅 1B 成就多项 SOTA 表现

相关推荐

企业微信AI助理"大圆"内测：一句话写周报，专治99+群聊消息

QQ宠物携AI大脑重生：接入腾讯Hy3 大模型，这次真的会"回应"你

解锁“碰一碰”分享！腾讯 WorkBuddy 首发上架鸿蒙 PC 应用市场

腾讯混元"合二为一"：多模态与大语言模型部门合并，姚顺雨统管冲全模态上限

腾讯甩出 WorkBuddy Bench：一套把代码、网页、办公、安全全装进来的编码智能体考场

腾讯发布 HunyuanOCR 开源模型，参数仅 1B 成就多项 SOTA 表现

相关推荐

​企业微信AI助理"大圆"内测：一句话写周报，专治99+群聊消息

QQ宠物携AI大脑重生：接入腾讯Hy3 大模型，这次真的会"回应"你

解锁“碰一碰”分享！腾讯 WorkBuddy 首发上架鸿蒙 PC 应用市场

腾讯混元"合二为一"：多模态与大语言模型部门合并，姚顺雨统管冲全模态上限

腾讯甩出 WorkBuddy Bench：一套把代码、网页、办公、安全全装进来的编码智能体考场

企业微信AI助理"大圆"内测：一句话写周报，专治99+群聊消息