最近、騰訊混元は新しく多言語翻訳モデル「Hy-MT2」のオープンソースを正式に発表し、同時にこのモデルを基盤とした「騰訊Hy翻訳」のマイクロアプリをリリースしました。ユーザーと開発者に高品質で効率的な翻訳ソリューションを提供することを目的としています。
Hy-MT2は3つのサイズを持つモデルファミリーであり、33種類の言語間の相互翻訳をサポートしており、さらに5種類の民族言語・方言の翻訳も可能です。その中で、Hy-MT2-1.8Bはモバイル端末向けに最適化された軽量モデルであり、騰訊が独自開発したAngelSlim 1.25ビット極端な量子化技術により、モデル容量は約440MBに圧縮されており、Appleやクアルコム、メディアテックなどの主流のスマートフォンチップ上で簡単にローカルオフライン推論が可能です。推論速度は前世代より1.5倍向上し、弱いネットワークまたはネットワークがない環境での翻訳ニーズを解決しています。

もう一つのエントリーモデルであるHy-MT2-30B-A3Bは、初めて混合エキスパートアーキテクチャを導入し、総パラメータ数を拡大しながら一度の推論ごとのアクティブパラメータ数を制御し、専門的なシナリオにおける最高の効果を目指しています。また、Hy-MT2-7Bは速度と効果のバランスを取った「ハッピー・サイズ」として定位されています。
性能面において、Hy-MT2シリーズは顕著な改善を遂げました。公式発表された評価データによると、一般的な翻訳能力(FLORES-200評価セット)において、3つのモデルは現在業界トップレベルの閉源モデルであるGemini3.1Proの88.1%、96.9%、および98.1%の水準に達しており、非常に近いです。
専門分野や実際のビジネスシナリオにおける翻訳においては、その性能はさらに優れています。金融、法務、教育など8つの分野をカバーするDomainMTBenchテストセットでは、モデルのスコアはGemini3.1Proに近いか、あるいは同等に達しています。特に金融、政治、教育などの垂直分野では、Hy-MT2-30B-A3Bは主流の翻訳モデルを一部上回っています。前世代と比較して、Hy-MT2は翻訳指示の遵守能力において大きな進歩を遂げており、ユーザーが用語、スタイル、出力形式などの個別要件をより正確に理解し、実行できるようになっています。

ユーザーが直感的に体験できるようにするために、「騰訊Hy翻訳」マイクロアプリはすでにリリースされており、音声入力やカスタム翻訳スタイルをサポートしています。iOSとAndroid用のアプリケーションも近日中にリリースされ、モデルのローカル化によるオフライン翻訳機能をサポートします。開発者や研究者にとって、このシリーズモデルのすべてのソースコードおよび異なる量子化バージョンはHugging Face、ModelScope、GitHubなどの主要なオープンソースプラットフォームに公開されており、さまざまなハードウェア構造上で展開することが可能です。
今回のHy-MT2のリリースは、騰訊混元が現実的な応用シナリオに焦点を当てた高品質で効率的な多言語翻訳モデルの構築において重要な一歩を踏み出したことを示しており、オープンソースと製品化の組み合わせを通じて、機械翻訳技術の実際の応用における導入と発展を推進しています。
