全球 AI 算力競賽再次加碼。5 月 25 日,埃隆·馬斯克(Elon Musk)正式宣佈,xAI 旗下最新旗艦模型 Grok V9-Medium 已圓滿完成訓練階段。作爲一款擁有 1.5 萬億(1.5T)參數的超大規模基礎模型,其規模是目前支撐 Grok 所有生產線流量的 v8-small 版本(0.5T 參數)的整整三倍。
核心看點:
規模跨越: 從 0.5T 直接躍升至 1.5T 參數,模型在推理深度與複雜任務處理能力上實現了質的飛躍。
編程特化: 在補充訓練階段,xAI 引入了海量 Cursor(AI 編程工具) 的代碼數據,旨在顯著增強其處理複雜編程任務的能力。
進度時間表: 目前模型已進入監督微調(SFT)階段,強化學習(RL)即將啓動,預計在 2 至 3 周內正式面向公衆發佈。
底層架構優化: 馬斯克透露,該模型經過了針對 NVIDIA Blackwell 架構 GPU 的深度優化,算力效率將大幅提升。
“編程 AI”新格局:xAI 正面硬剛頂尖代碼助手
此次 Grok V9-Medium 的發佈,最引人矚目的在於其“編程基因”。馬斯克此前曾坦言,現有的 v8-small 版本在訓練數據的質量、全面性及比例平衡上存在明顯短板,而 V9-Medium 則是針對這些痛點進行的系統性重構。
通過引入 Cursor 的代碼邏輯與實戰數據,xAI 意圖讓這款新模型在開發者生態中建立絕對的技術優勢。對於開發者而言,Grok V9-Medium 不僅僅是一個通用的聊天機器人,更有望成爲能夠深度理解複雜代碼庫、自主完成複雜編程邏輯的“AI 工程師”。
爲什麼要加 Cursor 的數據?
Cursor 作爲當前主流的 AI 編程輔助工具,其背後的代碼調用習慣、工程化思路和 bug 修復路徑代表了頂尖軟件工程的實踐。xAI 將這些數據納入“補充訓練”(Supplemental Training),意味着 Grok 將跳過單純的語言模型階段,直接進入“工程化實踐”階段。
這種做法被行業觀察者視爲 xAI 的“換道超車”:不再僅僅通過通用的語料庫進行訓練,而是直接學習人類專業工程師在編程工具中最真實、最直接的思維方式。
市場預期:大模型“基準”之戰將重寫
隨着 Grok V9-Medium 預計在 6 月中旬上線,AI 領域的競爭將進入新一輪白熱化:
性能標杆的重塑: 1.5T 參數規模意味着它在邏輯推理與複雜指令遵循上,將直接對標業界最頂尖的多模態模型。
Blackwell 架構的紅利: 作爲首批深度適配 Blackwell 架構的 AI 大模型,其在處理效率和推理成本上的表現,將直接影響 xAI 在 Tesla 車輛端側與 X 平臺應用端的部署策略。
對於 xAI 團隊而言,Grok V9-Medium 不僅是性能上的升級,更是其構建“開發者優先”AI 平臺的關鍵一步。在接下來的兩週內,隨着微調與強化學習工作的收尾,這款“編程利器”的表現將決定它能否在代碼輔助與開發者工具賽道中,從 Anthropic 的 Claude 或 DeepSeek 等競爭對手手中分得一杯羹。
