近日,埃隆・马斯克创办的 xAI 公司宣布推出 Grok4.1,这是对现有 Grok4模型的一次升级。此次更新带来了两款新模型,分别为 Grok4.1和 Grok4.1Thinking,这两款模型均可免费使用,但付费用户的使用限制会较少。

据 xAI 表示,Grok4.1在生成内容时的 “幻觉” 现象发生概率降低了三倍,相较于之前的版本,这使得 Grok4.1成为 xAI 迄今为止最佳的发布版本之一。然而,目前尚不清楚 Grok4.1在性能上与其竞争对手,如最新发布的 GPT5.1相比如何,后者在情感智力和性能方面有所提升。

根据 LMArena 的 Text Arena 工具提供的初步性能数据,Grok4.1(Thinking)和 Grok4.1在各项竞争测试中均表现优异。Text Arena 是一个开源工具,允许用户通过并排、盲测和随机化测试对不同的大型语言模型进行比较。
在最新的基准测试中,Grok4.1(Thinking)以1510的得分排名第一,而 Grok4.1则以1437的得分位列第19。根据测试平台的反馈,相较于两个月前推出的 Grok4Fast,这一版本的得分提升了40多分。
尽管 Grok4.1的升级值得关注,但可能并不是今年最强的模型。谷歌正在准备推出 Gemini3.0,预计这将是迄今为止功能最强大的模型。

介绍:https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf
划重点:
🌟 Grok4.1推出,包含 Grok4.1和 Grok4.1Thinking 两款模型,均可免费使用。
📉 新模型在生成内容时幻觉现象减少三倍,提高了内容生成的准确性。
🏆 初步基准测试显示 Grok4.1(Thinking)获得最佳评分,表现优于前一版本。
