記事本文

xAIがGrok4.20を発表：推論性能が大幅に向上不確定性率78％で業界記録を樹立

公開AI二ュ-ス

時間 :Mar 13, 2026

読む :1分

2026年3月12日、xAIは新世代の大規模言語モデル「Grok4.20Beta」を正式にリリースしました。このモデルは価格の競争力を持ちながら、非常に高い事実の信頼性により業界記録を更新しました。

「Artificial Analysis」の最新評価によると、推論機能を有する知能指数（Intelligence Index）においてGrok4.20は48点を獲得し、前バージョンより6ポイント向上しました。総合的なベンチマークテストでは、「Gemini3.1Pro Preview」と「GPT-5.4」（ともに57点）にはまだ差があるものの、AA全知テストでのパフォーマンスは非常に優れており、偽情報を作り出す問題が一般的に存在するAIモデルにおいても、非幻覚率が78%と非常に高く、偽情報の生成問題を効果的に解決しています。

製品ラインナップとエンジニアリングパラメータに関して、xAIは推論機能付き、推論機能なし、およびマルチエージェントモードの3つのAPIバージョンを同時にリリースしました。このモデルは最大で200万トークンのコンテキストウィンドウをサポートしており、市場への浸透力のある価格戦略を採用しており、100万トークンあたりのコストはわずか2ドルから6ドルと、Grok4に比べて大幅に低下しています。技術面では、Grok4.20は未知の分野に直面した際に非常に慎重であり、「知らない」という頻度が大幅に増加しており、誤り率は約五分の一にとどまっています。

Grok、マスク、xAI

現在、世界中の大規模モデルの競争は単なるパラメータの規模から、推論の深さと事実の正確性という二重の競争に移行しています。Grok4.20の登場は、xAIが汎用人工知能（AGI）を目指す過程において、「誠実性」と「低幻覚率」を強化することで差別化の優位性を構築しようとしていることを示しています。このような事実の信頼性への極端な追求は、AIが厳密な業界での応用における実現可能性を高めるだけでなく、今後のマルチエージェント協働をより堅固な情報信頼の基盤で支えることにもつながります。

人ではなくコードに賭ける：ZigプロジェクトがLLMによる貢献を全面的に禁止し議論を呼ぶ

ジェネレーティブAIがプログラミング分野を席巻する中、Zigオープンソースプロジェクトは逆張りの厳格な方針を導入しました。大規模言語モデルによって生成されたコードやコメントの貢献を全面的に禁止しています。有名開発者であるSimon Willisonによる解説後、コミュニティ内で技術効率と人材育成の対立が議論されています。核心的な矛盾は、コードの生成と人材の成長の選択肢にあります。Zigのメンテナーより「貢献」の定義が再評価され、独自性と学習過程の重要性が強調されました。

Apr 30, 2026

213.5k

Moonshot AIと清华大学がPrfaaSアーキテクチャを発表大規模モデルの計算力の限界を突破

大規模言語モデルの推論効率に大きな進展が見込まれる。清华大学とMoonshot AIは、プリフィル即サービスという新しいアーキテクチャを共同で提案した。このアーキテクチャでは、推論プロセスをプリフィルとデコードの2つのフェーズに分割し、計算リソースの配分を最適化することで、ハードウェアの制限問題を効果的に解決し、モデルサービスのパフォーマンスを著しく向上させた。

Apr 20, 2026

246.4k

OpenAIが生物学専用の大規模モデルGPT-Rosalindを発表、研究の加速を目指す

OpenAIが生物学専用大モデルGPT-Rosalindを発表。ゲノムデータの過負荷と専門用語の壁という研究課題に対応し、汎用科学モデルとの差別化を図る。....

Apr 17, 2026

275.3k

本当のAI個人アシスタントをめざす：アップルが社内トレーニングセッションを開催　Siriの進化の基盤を解説

Apple launches 'AI Coding Bootcamp' for Siri engineers to enhance their large language model skills, supporting next-gen Siri and iOS AI features. This strategic move aims to catch up with Google and OpenAI in generative AI, focusing on prompt engineering and full-cycle model deployment.....

Apr 16, 2026

196.6k

NAACPがエロン・マスクのxAIを毒物排出で告発

NAACPがxAIを提訴。メンフィスの黒人コミュニティで有毒汚染物質を違法排出し、大気浄化法違反と主張。データセンター用発電所が問題に。....

Apr 15, 2026

132.1k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

xAIがGrok4.20を発表：推論性能が大幅に向上 不確定性率78％で業界記録を樹立

関連推奨