由量化平臺 nof1.ai 主辦的 Alpha Arena1.5賽季揭曉成績單:xAI 內部代號 Grok4.20的實驗模型以 +12.11% 報率奪冠,將1萬美元起始資金在14個交易日內變爲12,193美元,成爲唯一實現正收益的大型語言模型;同期 GPT-51與 Gemini3.0分別虧損3.4% 與5.7%。
四種“地獄模式”下無人干預
賽事規則禁止任何人類調倉,模型需在“苦行僧模式”(高槓杆限制)與“情境感知模式”(可窺探對手持倉)之間自動切換。Grok4.20在情境感知回合提前2小時建立 Palantir(PLTR)10倍槓桿多單,當日散戶情緒指數飆升38%,收盤獲利11.4%,被主辦方稱爲“教科書級情緒套利”。
實時 X 數據流成殺手鐗
主辦方披露,Grok4.20可毫秒級調用 X(Twitter)Firehose,日均處理6,800萬條英文推文,利用內置情緒-量價模型生成1-5分鐘超短期信號。對比之下,GPT-51僅能使用延遲15分鐘的新聞摘要,Gemini3.0依賴財報與 SEC 文件,信息時效落後30分鐘以上。
馬斯克親自“點贊”,Grok5已在路上
xAI 創始人馬斯克賽後發帖:“Grok knows the vibes.4.20→5.0🚀”,暗示下一代 Grok5將把實時情緒引擎升級爲多模態“市場-社羣-宏觀”三維框架。市場傳聞,xAI 計劃2025Q1推出面向機構的“Grok Trader API”,年費高達50萬美元,目前已收到20餘家對衝基金意向訂單。
華爾街敲響警鐘
nof1.ai 首席執行官表示,比賽旨在探索“LLM 直接下單”可行性,結果證明情緒數據+強化學習可產生超額收益,“當模型能在2小時內讀懂散戶 Meme,傳統量化基金的高頻優勢將被削弱”。不過,他也提醒,單一週期的勝利不代表策略穩健,未來賽季將引入 T+0雙向交易、期權與加密貨幣,進一步檢驗模型適應性。
行業信號:AI 交易進入“實時情緒”階段
此次對決被視爲 LLM 在金融場景的首次公開“實盤”較量。Grok4.20的勝利顯示,社交媒體實時流+大模型推理或成爲下一代量化武器,也意味着數據時效比模型參數更關鍵。隨着更多開源情緒模型涌現,散戶與機構之間的信息壁壘可能進一步被打破。
