小米社は先日、朗報を発表しました。小米の大規模言語モデルチームの2本の論文が、2025年の北米計算言語学会(NAACL)会議に採択され、主会発表論文として掲載されることになったのです。この快挙は、小米の人工知能分野における深い蓄積と、技術応用の急速な発展を示しています。
これらの論文は、それぞれグラフィカルユーザーインターフェース(GUI)エージェントと機械翻訳に焦点を当てています。GUIエージェントに関する小米の研究では、携帯電話の操作タスクをページ到達とページ操作の2つのサブタスクに細分化することで、インテリジェントエージェントが各ステップの最適解を追求するだけでなく、全体的なタスク完了能力に集中できるようにしました。この手法により、スマートアシスタントの効率が向上し、ユーザーの携帯電話使用体験がよりスムーズになります。
機械翻訳分野では、小米チームは大規模言語モデルに基づいて深入研究を行い、多言語翻訳の最適な訓練パラダイムを探求し、一連の翻訳モデルをオープンソース化しました。これらの成果は、現在小愛翻訳で実際に活用されており、ユーザーの翻訳体験を大幅に向上させています。例えば、字幕のない外国語の動画を視聴する場合、ユーザーは言語の壁に悩まされることなく、外国映画の世界に没頭し、異文化の魅力を堪能できます。また、外国語のウェブサイトを閲覧する場合も、ワンクリックで正確な内容の解釈を得ることができ、簡単に言語の壁を突破できます。
小米は、今回の研究成果の発表は、基礎技術への深耕と長年にわたる継続的な投資の成果であると述べています。小愛翻訳の多言語対応により、ユーザーは日常生活中、外国語に出会った際に、迅速かつ正確な翻訳を得ることができ、いつでもどこでも言語の壁に対応できるようになりました。
この技術は小米ユーザーにとって有益であるだけでなく、世界のテクノロジー競争における小米の実力と先見性を示しています。今後、小米は技術革新に引き続き取り組み、ユーザーにより良いサービスと体験を提供していきます。