近日,騰訊混元宣佈正式開源其全新多語言翻譯模型Hy-MT2,並同步推出了基於該模型的“騰訊Hy翻譯”小程序,旨在爲用戶和開發者提供高質量、高效率的翻譯解決方案。
Hy-MT2是一個包含三種尺寸的模型家族,均支持多達33種語言的互譯,幷包含5種民族語言/方言的翻譯支持。其中,Hy-MT2-1.8B作爲專爲移動端優化的輕量級模型,得益於騰訊自研的AngelSlim1.25-bit極端量化技術,模型體積被壓縮至僅約440MB,可輕鬆部署在蘋果、高通、聯發科等主流手機芯片上進行本地離線推理,推理速度相比上一代提升1.5倍,解決了弱網或無網環境下的翻譯需求。

另一款旗艦模型Hy-MT2-30B-A3B則首次引入了混合專家架構,在擴大總參數規模的同時,控制每次推理的激活參數量,旨在追求專業場景下的極致效果。此外,Hy-MT2-7B則定位爲平衡速度與效果的“甜點”尺寸。
在性能表現上,Hy-MT2系列實現了顯著提升。根據官方公佈的評測數據,在通用翻譯能力(FLORES-200評測集)上,三款模型分別達到了當前行業頂級閉源模型Gemini3.1Pro 的88.1%、96.9%和98.1%水平,已非常接近。
在專業領域和真實業務場景的翻譯中,其表現更爲突出,在涵蓋金融、法律、教育等8個領域的DomainMTBench測試集上,模型評分也接近或達到了Gemini3.1Pro的水平,尤其在金融、政治、教育等垂直領域,Hy-MT2-30B-A3B已部分超越主流翻譯模型。相比上一代,Hy-MT2在翻譯指令遵循能力上進步明顯,能更準確地理解並執行用戶在術語、風格、輸出格式等方面的個性化要求。

爲了讓用戶能夠直觀體驗,基於Hy-MT2模型打造的“騰訊Hy翻譯”小程序已經上線,支持語音輸入和自定義翻譯風格。其iOS和安卓應用程序也即將發佈,將支持模型本地化部署的離線翻譯功能。對於開發者和研究者而言,該系列模型的全部源代碼及不同量化版本已在Hugging Face、ModelScope、GitHub等主流開源平臺發佈,支持在多種硬件架構上部署。
此次Hy-MT2的發佈,標誌着騰訊混元在構建面向真實應用場景的高質量、高效率、多語言翻譯模型方面邁出了堅實一步,並通過開源與產品化相結合的方式,推動機器翻譯技術在實際應用中的落地與發展。
