腾讯开源超轻量离线翻译模型，手机端运行仅需0.4GB内存

4月29日，腾讯混元团队宣布正式开源其极限量化压缩版的翻译模型——Hy-MT1.5-1.8B-1.25bit。这款模型最大的亮点在于，它将支持33种语言的翻译能力精准压缩到了440MB左右，这意味着即便是存储空间紧凑的移动设备，也能在完全不联网的状态下实现高质量的实时翻译。

这一成果源于腾讯此前发布的专业翻译大模型Hy-mt1.5。原始的1.8B模型在常规精度下需要占用约3.3GB的内存，这对于手机端运行而言无疑是沉重的负担。为了解决这一痛点，研发团队采用了极致的量化压缩技术，将参数表达由16位（16-bit）降至最低1.25位。

通俗来讲，这一过程类似于在不损失关键细节的前提下，将一张4K高清大图压缩成体积极小的微缩图。针对不同性能的设备，腾讯此次同步推出了2-bit和1.25-bit两种量化方案，确保模型在“瘦身”后依然能够保持卓越的语义理解能力。

虽然体积大幅缩小，但在性能表现上并未缩水。根据官方公布的评测数据，这款1.8B参数级的轻量模型在多个基准测试中，翻译质量已经能够比肩甚至超越谷歌翻译等主流商业系统，甚至在某些维度上可以与千亿级（235B）的大型模型抗衡。

目前，该模型已原生支持包括中、英、日、法、俄、阿拉伯语在内的33种语言，并涵盖了藏语、蒙古语等少数民族语言。此外，它还支持5种方言及民汉互译，总计翻译方向高达1056个，极大地拓宽了离线翻译的应用边界。

除了单纯的权重开源，该技术已在实际场景中展现出极高的实用价值。在最新适配的演示版本中，该模型支持“后台取词模式”，无论用户是在离线阅读邮件还是浏览本地网页，翻译功能都能即唤即用。

值得关注的是，由于翻译过程完全在本地设备运行，不涉及任何个人隐私信息的上传或云端采集，这为对数据安全有极高要求的用户提供了可靠保障。目前，该翻译能力已在腾讯内部的会议系统、办公软件及浏览器等多个核心业务场景中落地应用。

为了方便开发者和技术爱好者体验，相关模型已在Huggingface及魔搭社区同步上线。这标志着高精度翻译技术正加速从云端走向终端，让翻译服务真正成为随身携带、触手可及的基础工具。

腾讯混元发布科研智能体Hyra-1.0，单一框架打通AI研发与科学发现