從編碼到創意寫作 xAI Grok-3 擊敗 GPT4.5全能登頂大模型競技場

xAI 最近發佈了一則激動人心的消息，其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表現突出。這款模型被命名爲“grok-3preview-02-24”，在多個關鍵領域展現了卓越性能。

xAI 的 Grok-3-Preview-02-24就以1分的微弱優勢超越 GPT4.5-Preview。Grok-3獲得了超過3，000票，並總體上與第一名並列。它在困難提示、編碼任務、數學問題、創意寫作、指令遵循以及處理較長查詢方面表現尤爲出色。Chatbot Arena 是一個通過人類偏好進行大規模語言模型（LLM）評估的衆包平臺，使用 Elo 評級系統爲模型排名，提供全面的性能衡量。

這一成就標誌着 xAI 和其創始人埃隆·馬斯克在 AI 發展領域的顯著進展。馬斯克一直倡導開發強大且與人類價值觀相符的 AI。Grok-3在這一基準測試中的成功凸顯了模型的能力，以及 xAI 在競爭激烈的 AI 領域的進步。

值得注意的是，“grok-3preview-02-24”被描述爲最新生產模型，但名稱中包含“preview”，這可能表明它仍處於測試階段，這一細節可能引發對其完全生產就緒性的討論。

SpaceX展示纖薄AI設備原型，深度整合xAI技術並對標OpenAI

SpaceX展示了一款類似手機的AI設備原型，比iPhone更纖薄，介乎觸屏手機與Rabbit R1之間，引發其進軍消費電子和移動業務的猜測。儘管馬斯克公開否認報道“純屬捏造”，但此舉仍被視爲釋放拓展信號，項目處於早期，設計或調整。

四周內兩度敗訴！馬斯克狀告 OpenAI 竊取商業機密被美法官駁回

美國舊金山聯邦法官駁回xAI對OpenAI的訴訟，因缺乏證據證明OpenAI誘導前員工泄露Grok聊天機器人商業機密。法官指出，xAI未能證明OpenAI唆使前高級工程師李雪辰泄密，也未發現OpenAI員工參與不當行爲。此裁決終結了馬斯克公司對競爭對手的法律指控。

xAI被曝曾利用Claude輸出數據訓練編碼模型，因Anthropic撤銷權限轉入地下提取

埃隆·馬斯克的AI公司xAI被曝利用Anthropic的Claude模型數據訓練Grok編碼模型，儘管Anthropic於2026年1月撤銷其API訪問權限，xAI工程師仍通過個人賬戶和第三方服務Blackbox AI祕密提取數據。馬斯克此前在法庭上承認xAI“部分”使用了該數據。

從編碼到創意寫作 xAI Grok-3 擊敗 GPT4.5全能登頂大模型競技場

相關推薦

兩分鐘上手生產級語音智能體：xAI 發佈 Voice Agent Builder 測試版

SpaceX展示纖薄AI設備原型，深度整合xAI技術並對標OpenAI

四周內兩度敗訴！馬斯克狀告 OpenAI 竊取商業機密被美法官駁回

馬斯克再度碰壁：法院駁回xAI針對OpenAI的商業機密訴訟

xAI被曝曾利用Claude輸出數據訓練編碼模型，因Anthropic撤銷權限轉入地下提取

從編碼到創意寫作 xAI Grok-3 擊敗 GPT4.5全能登頂大模型競技場

相關推薦

兩分鐘上手生產級語音智能體：xAI 發佈 Voice Agent Builder 測試版

SpaceX展示纖薄AI設備原型，深度整合xAI技術並對標OpenAI

​四周內兩度敗訴！馬斯克狀告 OpenAI 竊取商業機密被美法官駁回

馬斯克再度碰壁：法院駁回xAI針對OpenAI的商業機密訴訟

xAI被曝曾利用Claude輸出數據訓練編碼模型，因Anthropic撤銷權限轉入地下提取

四周內兩度敗訴！馬斯克狀告 OpenAI 竊取商業機密被美法官駁回