マスクが所有するAIスタートアップ企業のxAIは、2026年6月1日に公式求人サイトで公告を発表し、世界中から中国語のAIトレーナーを公開募集することになりました。この取り組みは、同社のエース大規模モデル「Grok」の音声対話および多言語処理能力を全面的に最適化・向上させるためのものです。この戦略的な動きは、xAIがマルチモーダル音声技術分野においてさらに力を入れていることを示しています。

Grok、マスク、xAI

求人情報によると、このポジションは非常に競争力のある給与を提供しており、時給は35~45ドル(約237~304元)の間で、働き方は非常に柔軟で、フルタイム、パートタイム、契約制のリモートワークが可能です。週に最低でも10時間程度の作業が必要です。従来のテキストのラベリングとは異なり、今回の募集の核心的なタスクは、大規模モデルの多言語音声の深い学習に焦点を当てています。

具体的な業務内容には、音声のラベリング、録音、文字起こし、イントネーションやトーンの評価など、専門的な側面が含まれます。xAIは応募者に中国語の母語レベルを必須としており、異なるイントネーション、方言、地域変体について深い理解を持つことが求められます。また、英語はB2レベル以上であることが必要で、自然な英語の音声録音を確保します。言語学、音声学、吹き替え、または音声データのラベリングに関する経験がある応募者は優先されます。

現在、世界的な大規模モデルの競争は、単なるテキスト理解から音声、画像などのマルチモーダルリアルタイムインタラクションへの段階へと進化しています。xAIが中国語の音声専門家を高額で募集しているのは、Grokが中国語の多様な文脈におけるイントネーションやトーンの障壁を解消するためだけでなく、OpenAIやAnthropicなどの先進的なグローバルなマルチモーダル競争の中でより深い技術的バッファーを構築するためでもあります。この動きにより、Grokがエッジ側の音声インタラクションおよび文化間アプリケーションでの実用化プロセスが著しく加速されることが予想されます。