4月29日、騰訊・ホンユアンチームは、極限的な量化圧縮版の翻訳モデル「Hy-MT1.5-1.8B-1.25bit」を正式にオープンソース化することを発表しました。このモデルの最大の特徴は、33言語の翻訳機能を約440MBにまで正確に圧縮していることで、これにより、ストレージ容量が限られているモバイルデバイスでも、完全なオフライン状態で高品質なリアルタイム翻訳が可能になります。

image.png

極限的な圧縮:スマホメモリの「軽量化」革命

この成果は、騰訊が以前に公開した専門的な翻訳大規模モデル「Hy-mt1.5」に起因しています。もともとの1.8Bパラメータモデルは通常の精度では約3.3GBのメモリを必要とし、これはスマートフォンでの動作には重い負担でした。この課題を解決するため、研究開発チームは極限的な量化圧縮技術を使用し、パラメータの表現を16ビット(16-bit)から最低1.25ビットまで引き下げました。

通俗的に言うと、このプロセスは、重要な細部情報を損なうことなく、4Kハイビジョンの大画像を体積が非常に小さいマイクロ画像に圧縮するようなものです。異なる性能を持つデバイスに対応するため、騰訊は今回は2ビットと1.25ビットの2つの量化方案を同時に提供し、モデルが「痩せた」後でも優れた意味理解能力を維持できるようにしています。

実測性能:オフライン状態での翻訳品質が主流製品を凌駕

体積が大幅に小さくなったにもかかわらず、パフォーマンスの面では劣っていません。公式に公開された評価データによると、この1.8Bパラメータの軽量モデルは複数の基準テストにおいて、グーグル翻訳などの主要な商用システムと同等、あるいはそれ以上に翻訳品質を達成しており、ある特定の観点ではテラバイト級(235B)の大型モデルと対等に競えるほどの性能を持っています。

image.png

現在、このモデルは中国語、英語、日本語、フランス語、ロシア語、アラビア語など33言語をサポートしており、チベット語やモンゴル語などの少数民族言語も含みます。また、5種類の方言および民漢相互翻訳をサポートしており、合計で1056の翻訳方向をカバーしており、オフライン翻訳の応用範囲を大きく広げています。

深く統合された設計:プライバシーの安全と使い勝手の両立

単なる重みのオープンソース化だけでなく、この技術は実際の場面で非常に高い実用価値を示しています。最新の適合バージョンでは、「バックグラウンド単語抽出モード」をサポートしており、ユーザーがオフラインでメールを読んだり、ローカルウェブページを閲覧したりしている間でも、翻訳機能を即座に使用できます。

注目すべきは、翻訳プロセスがすべてローカルデバイスで行われ、個人情報のアップロードやクラウド収集が一切ないため、データセキュリティに対して非常に高い要求があるユーザーにとって信頼性のある保障となっています。現在、この翻訳能力は騰訊内の会議システム、オフィスソフト、ブラウザなどの主要なビジネスシナリオに実際に導入されています。

開発者やテクノロジー愛好家が体験しやすいように、関連モデルはHuggingfaceおよび魔搭コミュニティで同時に公開されました。これは、高精度翻訳技術が雲から端末へと加速して移行していることを示しており、翻訳サービスが本当に持ち運びやすく、手軽に利用できる基本的なツールとなることを意味しています。