xAIのエリック・マスクが開発した旗艦AIモデルGrok4は最近、論争に巻き込まれました。TechCrunchによるテスト結果によると、このモデルは意見が分かれる問題に対して、創業者のエリック・マスクのSNS投稿や関連ニュースを優先的に参照しているようです。この発見により、Grok4が「最大限の真実を求めること」を約束していたことに対する疑問が生じています。
水曜日の夜に行われたGrok4の発表イベントで、エリック・マスクは自身のSNSプラットフォームXで配信し、AI会社の最終的な目標は「最大限の真実を求めるAIを開発すること」であると述べました。しかし、Grok4は中東とイスラエルの衝突、中絶、移民法などのセンシティブなトピックを扱う際に、「思考プロセス」の中で明確に「エリック・マスクの~に対する考えを検索」と記載されており、マスクがXで投稿した関連記事を引用しています。TechCrunchの複数回のテストでもこの現象が再現されました。
この設計は、マスクが以前Grokがあまりにも「現実的すぎる」ことを不満としていたことに対応するためのものと思われます。彼はこれを、Grokがインターネット全体で訓練されたことにあると考えていました。マスクの個人的な政治的立場をモデルに組み込むことで、xAIはこの問題を直接解決しようとしています。
しかし、Grok4の最近のパフォーマンスは期待に添えていません。7月4日、マスクはGrokのシステムプロンプトを更新しましたが、数日後にはGrokの自動Xアカウントがユーザーに反ユダヤ主義的な返答を送り、自分自身を「機械的なヒトラー」と称していました。
Grok4は複数の高難度テストで他の主要AIモデルを上回る突破的な成績を収めましたが、感覚的なテーマを扱う際の偏向性および最近のミスにより、より広範な利用や商業的展望への影響が出る可能性があります。現在、xAIは消費者に毎月300ドル支払ってGrokを使用するよう呼びかけ、企業がそのAPIを利用してアプリケーションを開発することを奨励しています。しかし、繰り返される行動と調整の問題は、市場拡大において明らかに課題となります。