最近、エロン・マスクが設立したxAI社は、Grok4.1をリリースしたと発表しました。これは既存のGrok4モデルのアップグレード版です。今回の更新により、新たにGrok4.1およびGrok4.1Thinkingという2つのモデルが登場しました。これらは無料で利用できますが、有料ユーザーの使用制限は少なくなります。

image.png

xAIによると、Grok4.1ではコンテンツ生成時の「幻覚(hallucination)」現象の発生確率が前のバージョンよりも3倍減少し、これによりGrok4.1はxAIにとってこれまでで最も優れたリリースの一つとなりました。ただし、Grok4.1が最新版のGPT5.1などの競合製品と比べて性能面でどうかはまだ不明です。後者は感情知能やパフォーマンス面での向上が見られます。

image.png

LMArenaのText Arenaツールによる初期のパフォーマンスデータによると、Grok4.1(Thinking)およびGrok4.1はさまざまな競争テストで優れた成績を収めています。Text Arenaは、ユーザーが並べて比較したり、盲測やランダム化テストを通じて異なる大規模言語モデルを比較できるオープンソースツールです。

最新のベンチマークテストでは、Grok4.1(Thinking)が1510ポイントで1位を獲得し、Grok4.1は1437ポイントで19位となりました。テストプラットフォームからのフィードバックによると、2か月前にリリースされたGrok4Fastに比べてこのバージョンのスコアは40点以上も向上しています。

Grok4.1のアップグレードは注目すべきですが、今年最も強力なモデルとは言えないかもしれません。グーグルはGemini3.0のリリース準備を進めているとされ、これはこれまでで最も機能が強力なモデルとなる予定です。

紹介:https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf

要点:  

🌟 Grok4.1が登場し、Grok4.1とGrok4.1Thinkingの2つのモデルを含み、どちらも無料で利用可能です。  

📉 新しいモデルではコンテンツ生成時の幻覚現象が3倍減少し、コンテンツ生成の正確性が向上しています。  

🏆 初期のベンチマークテストではGrok4.1(Thinking)が最高スコアを獲得し、前のバージョンより優れた性能を示しています。