2026年3月12日、xAIは新世代の大規模言語モデル「Grok4.20Beta」を正式にリリースしました。このモデルは価格の競争力を持ちながら、非常に高い事実の信頼性により業界記録を更新しました。
「Artificial Analysis」の最新評価によると、推論機能を有する知能指数(Intelligence Index)においてGrok4.20は48点を獲得し、前バージョンより6ポイント向上しました。総合的なベンチマークテストでは、「Gemini3.1Pro Preview」と「GPT-5.4」(ともに57点)にはまだ差があるものの、AA全知テストでのパフォーマンスは非常に優れており、偽情報を作り出す問題が一般的に存在するAIモデルにおいても、非幻覚率が78%と非常に高く、偽情報の生成問題を効果的に解決しています。

製品ラインナップとエンジニアリングパラメータに関して、xAIは推論機能付き、推論機能なし、およびマルチエージェントモードの3つのAPIバージョンを同時にリリースしました。このモデルは最大で200万トークンのコンテキストウィンドウをサポートしており、市場への浸透力のある価格戦略を採用しており、100万トークンあたりのコストはわずか2ドルから6ドルと、Grok4に比べて大幅に低下しています。技術面では、Grok4.20は未知の分野に直面した際に非常に慎重であり、「知らない」という頻度が大幅に増加しており、誤り率は約五分の一にとどまっています。

現在、世界中の大規模モデルの競争は単なるパラメータの規模から、推論の深さと事実の正確性という二重の競争に移行しています。Grok4.20の登場は、xAIが汎用人工知能(AGI)を目指す過程において、「誠実性」と「低幻覚率」を強化することで差別化の優位性を構築しようとしていることを示しています。このような事実の信頼性への極端な追求は、AIが厳密な業界での応用における実現可能性を高めるだけでなく、今後のマルチエージェント協働をより堅固な情報信頼の基盤で支えることにもつながります。
