テンセント・ハンドゥンは本日、翻訳モデル1.5バージョンの正式なオープンソース化を発表しました。今回のアップデートには2つの異なるサイズのモデルが含まれています:Tencent-HY-MT1.5-1.8B と Tencent-HY-MT1.5-7B で、最適な効率と画期的な翻訳品質を通じて、エッジとクラウドを連携させた翻訳体験を再定義することを目的としています。

コアの特徴:エッジでの配置と優れた性能
今回のリリースでは、1.8Bモデルが特に目立ちます。これはスマートフォンなどの消費者向けデバイスに向けた軽量モデルであり、量子化処理を経た後でもわずか1GBのメモリでオフラインでのスムーズな動作が可能です。
極めて高速:50トークンの処理にかかる平均時間はわずか0.18秒で、主流の商用翻訳APIの0.4秒よりもはるかに速いです。
多段階の性能:FLORES-200などの権威あるテストデータセットにおいて、Gemini-3.0-Proなどの大規模な非公開モデルの90パーセンタイルレベルに達しており、中規模のオープンソースモデルを全面的に上回っています。

幅広いカバー範囲:主要言語から地方言語・民漢まで
ハンドゥン翻訳モデル1.5は中国語、英語、日本語、フランス語など33の世界の言語の相互翻訳をサポートし、チェコ語、エストニア語、アイスランド語などの小規模言語にも特に強化された対応をしています。さらに、モデルは5種類の国内の民漢言語および方言もカバーしており、AI翻訳の応用範囲を大幅に拡大しています。
機能の進化:実用性の高い翻訳体験
実際の使用シナリオに応じて、1.5バージョンは3つの側面で重要なアップグレードを行いました:
カスタム用語ライブラリ:医療、法律、金融などの専門分野に対してユーザーが専門用語リストをアップロードでき、専門用語の翻訳の一貫性を確保します。
文脈理解:長文の会話理解能力が向上し、前文の文脈に基づいて後続の結果を最適化し、意味の断絶を防ぎます。
形式保持能力:正確な指示に従うことで、モデルは翻訳後に元のテキスト(ウェブページ、コード、Markdownなど)の形式を完璧に保持できます。
技術的突破:大規模モデルが小規模モデルを導く
HY-MT1.5-1.8Bが小さなモデルで大きな成果を収めているのは、テンセントが採用したOn-Policy Distillation(大規模モデルの蒸留)戦略のおかげです。7Bサイズの「教師」モデルがリアルタイムで「生徒」モデルを指導し、予測の偏りから学習するようにし、単純に答えを暗記するだけでなく、小規模モデルの論理的および翻訳能力を顕著に向上させました。
開発者エコシステム:多プラットフォームへの完全対応
現在、テンセントハンドゥンの翻訳モデル1.5は
テンセントミーティングや企業微信など、テンセントハンドゥンの翻訳技術は内部のさまざまな高負荷シナリオで実装されています。1.5バージョンのオープンソース化により、テンセントはより高品質なAI翻訳技術を一般化し、グローバルな開発者にコストパフォーマンスの良い翻訳ソリューションを提供することを目指しています。
