Grok 4.20 炒股封神：2周1萬美元變1.2萬，12%回報率碾壓GPT-5.1與 Gemini 3.0

由量化平臺 nof1.ai 主辦的 Alpha Arena1.5賽季揭曉成績單:xAI 內部代號 Grok4.20的實驗模型以 +12.11% 報率奪冠，將1萬美元起始資金在14個交易日內變爲12，193美元，成爲唯一實現正收益的大型語言模型;同期 GPT-51與 Gemini3.0分別虧損3.4% 與5.7%。

四種“地獄模式”下無人干預

賽事規則禁止任何人類調倉，模型需在“苦行僧模式”（高槓杆限制）與“情境感知模式”(可窺探對手持倉)之間自動切換。Grok4.20在情境感知回合提前2小時建立 Palantir(PLTR)10倍槓桿多單，當日散戶情緒指數飆升38%，收盤獲利11.4%，被主辦方稱爲“教科書級情緒套利”。

實時 X 數據流成殺手鐗

主辦方披露，Grok4.20可毫秒級調用 X（Twitter）Firehose，日均處理6，800萬條英文推文，利用內置情緒-量價模型生成1-5分鐘超短期信號。對比之下，GPT-51僅能使用延遲15分鐘的新聞摘要，Gemini3.0依賴財報與 SEC 文件，信息時效落後30分鐘以上。

馬斯克親自“點贊”，Grok5已在路上

xAI 創始人馬斯克賽後發帖:“Grok knows the vibes.4.20→5.0🚀”，暗示下一代 Grok5將把實時情緒引擎升級爲多模態“市場-社羣-宏觀”三維框架。市場傳聞，xAI 計劃2025Q1推出面向機構的“Grok Trader API”，年費高達50萬美元，目前已收到20餘家對衝基金意向訂單。

華爾街敲響警鐘

nof1.ai 首席執行官表示，比賽旨在探索“LLM 直接下單”可行性，結果證明情緒數據+強化學習可產生超額收益，“當模型能在2小時內讀懂散戶 Meme，傳統量化基金的高頻優勢將被削弱”。不過，他也提醒，單一週期的勝利不代表策略穩健，未來賽季將引入 T+0雙向交易、期權與加密貨幣，進一步檢驗模型適應性。

行業信號:AI 交易進入“實時情緒”階段

此次對決被視爲 LLM 在金融場景的首次公開“實盤”較量。Grok4.20的勝利顯示，社交媒體實時流+大模型推理或成爲下一代量化武器，也意味着數據時效比模型參數更關鍵。隨着更多開源情緒模型涌現，散戶與機構之間的信息壁壘可能進一步被打破。

粵語數字化里程碑!廣州大學發佈 AI-DimSum 多模態語料庫平臺

12月6日至7日，第十屆語言服務高級論壇在廣州大學舉行。會上，粵語語料庫建設與大模型評測實驗室發佈了AI-DimSum多模態粵語語料庫平臺，旨在突破粵語作爲“低資源語言”的數字化困境。該平臺圍繞“數字中文建設”和“大灣區文化數字化”需求，構建了多模態語料庫，推動粵語在人工智能時代的保護與發展。

Grok 4.20 炒股封神：2周1萬美元變1.2萬，12%回報率碾壓GPT-5.1與 Gemini 3.0

相關推薦

AI大模型投資賽落幕！阿里通義千問Qwen3-Max以22.32%收益率奪冠

AI 模型“炒股”比拼!DeepSeek 收益超14%，Gemini2.5Pro 慘虧四成

ChatGPT“廣告烏龍”事件發酵：OpenAI承認“推薦失準”，緊急關閉購物提示功能

粵語數字化里程碑!廣州大學發佈 AI-DimSum 多模態語料庫平臺

蘋果推出 STARFlow-V：一種顛覆傳統的視頻生成模型

Grok 4.20 炒股封神：2周1萬美元變1.2萬，12%回報率碾壓GPT-5.1與 Gemini 3.0

相關推薦

AI大模型投資賽落幕！阿里通義千問Qwen3-Max以22.32%收益率奪冠

AI 模型“炒股”比拼!DeepSeek 收益超14%，Gemini2.5Pro 慘虧四成

ChatGPT“廣告烏龍”事件發酵：OpenAI承認“推薦失準”，緊急關閉購物提示功能

粵語數字化里程碑!廣州大學發佈 AI-DimSum 多模態語料庫平臺

​蘋果推出 STARFlow-V：一種顛覆傳統的視頻生成模型

蘋果推出 STARFlow-V：一種顛覆傳統的視頻生成模型