4月29日,腾讯混元团队宣布正式开源其极限量化压缩版的翻译模型——Hy-MT1.5-1.8B-1.25bit。这款模型最大的亮点在于,它将支持33种语言的翻译能力精准压缩到了440MB左右,这意味着即便是存储空间紧凑的移动设备,也能在完全不联网的状态下实现高质量的实时翻译。

image.png

极致压缩:手机内存的“减负”革命

这一成果源于腾讯此前发布的专业翻译大模型Hy-mt1.5。原始的1.8B模型在常规精度下需要占用约3.3GB的内存,这对于手机端运行而言无疑是沉重的负担。为了解决这一痛点,研发团队采用了极致的量化压缩技术,将参数表达由16位(16-bit)降至最低1.25位。

通俗来讲,这一过程类似于在不损失关键细节的前提下,将一张4K高清大图压缩成体积极小的微缩图。针对不同性能的设备,腾讯此次同步推出了2-bit和1.25-bit两种量化方案,确保模型在“瘦身”后依然能够保持卓越的语义理解能力。

性能实测:断网状态下的翻译质量超越主流竞品

虽然体积大幅缩小,但在性能表现上并未缩水。根据官方公布的评测数据,这款1.8B参数级的轻量模型在多个基准测试中,翻译质量已经能够比肩甚至超越谷歌翻译等主流商业系统,甚至在某些维度上可以与千亿级(235B)的大型模型抗衡。

image.png

目前,该模型已原生支持包括中、英、日、法、俄、阿拉伯语在内的33种语言,并涵盖了藏语、蒙古语等少数民族语言。此外,它还支持5种方言及民汉互译,总计翻译方向高达1056个,极大地拓宽了离线翻译的应用边界。

深度集成:隐私安全与便捷体验并重

除了单纯的权重开源,该技术已在实际场景中展现出极高的实用价值。在最新适配的演示版本中,该模型支持“后台取词模式”,无论用户是在离线阅读邮件还是浏览本地网页,翻译功能都能即唤即用。

值得关注的是,由于翻译过程完全在本地设备运行,不涉及任何个人隐私信息的上传或云端采集,这为对数据安全有极高要求的用户提供了可靠保障。目前,该翻译能力已在腾讯内部的会议系统、办公软件及浏览器等多个核心业务场景中落地应用。

为了方便开发者和技术爱好者体验,相关模型已在Huggingface及魔搭社区同步上线。这标志着高精度翻译技术正加速从云端走向终端,让翻译服务真正成为随身携带、触手可及的基础工具。