本日、科大訊飛は最新開発の星火同伝音声大規模モデルを発表しました。これは、国内初となるエンドツーエンドの音声同伝機能を備えた大規模モデルの登場を意味します。この革新的な技術は、以前の訊飛の翻訳技術と比較して、全シーンでの翻訳効果が大幅に向上し、エンドツーエンドの応答時間も大幅に短縮されました。

星火同伝音声大規模モデルの発表により、ユーザーはよりスムーズで正確な同伝体験を得られるようになりました。訊飛のデモでは、星火同伝音声大規模モデルを搭載した訊飛翻訳機が、英中音声同伝においてほぼ遅延なく翻訳を実現しており、海外旅行や国際展示会などに最適です。この最適化により、翻訳字幕の表示速度が大幅に向上するだけでなく、中国語と英語の相互翻訳の正確性も保証されています。

微信截图_20250115110120.png

この星火同伝音声大規模モデルは、翻訳文の長さを逆方向に制御でき、音声からテキストへのエンドツーエンド翻訳において、意味単位の分割、文脈の理解、情報の再構成をストリーミングで行うことができます。同時に、ストリーミング音声合成技術により、意味単位のリズムの接続や適応的な速度調整が可能になり、翻訳の自然さと流暢さがさらに向上しています。

国際交流の場面では、日常会話、ビジネス交流、高度な同伝翻訳が必要な業界翻訳など、あらゆる場面で卓越した性能を発揮します。内容の完全性、情報の正確性、言語の質は業界をリードするレベルにあり、Google Gemini 2.0やOpenAI GPT-4oなどの同伝技術を凌駕しています。最速で5秒以内の同伝遅延を実現し、人間の専門家通訳者のレベルに達しています。

科大訊飛の星火同伝音声大規模モデルの発表は、国内のAI翻訳技術における大きなブレークスルーとなるだけでなく、将来の国際交流がより便利で効率的になることを示唆しています。