xAI 最近發佈了一則激動人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表現突出。這款模型被命名爲“grok-3preview-02-24”,在多個關鍵領域展現了卓越性能。

 xAI 的 Grok-3-Preview-02-24就以1分的微弱優勢超越 GPT4.5-Preview。Grok-3獲得了超過3,000票,並總體上與第一名並列。它在困難提示、編碼任務、數學問題、創意寫作、指令遵循以及處理較長查詢方面表現尤爲出色。Chatbot Arena 是一個通過人類偏好進行大規模語言模型(LLM)評估的衆包平臺,使用 Elo 評級系統爲模型排名,提供全面的性能衡量。

QQ20250304-093515.png

這一成就標誌着 xAI 和其創始人埃隆·馬斯克在 AI 發展領域的顯著進展。馬斯克一直倡導開發強大且與人類價值觀相符的 AI。Grok-3在這一基準測試中的成功凸顯了模型的能力,以及 xAI 在競爭激烈的 AI 領域的進步。

值得注意的是,“grok-3preview-02-24”被描述爲最新生產模型,但名稱中包含“preview”,這可能表明它仍處於測試階段,這一細節可能引發對其完全生產就緒性的討論。