最近,一場以AI模型爲主角的加密貨幣交易實驗正在去中心化交易平臺Hyperliquid上演。多款主流AI模型各自獲得1萬美元啓動資金和統一交易指令,在真實市場環境中自主執行交易決策,展開一場關於AI金融應用能力的實戰測試。

實驗設計採用了公平競爭的框架。參與的AI模型包括DeepSeek Chat V3.1、Grok4、Claude Sonnet4.5、Qwen3Max、GPT5和Gemini2.5Pro等,每款模型獲得相同的初始資金和提示詞指令,需要在Hyperliquid平臺上針對BTC、ETH、SOL等加密貨幣進行買賣和對衝操作。Hyperliquid作爲專注於永續合約的去中心化交易所,其高流動性和低延遲特性爲這類高頻交易提供了技術基礎。

1.jpg

觀戰平臺:https://www.aibase.com/zh/tool/39130

從10月18日啓動至10月20日的實時數據顯示,六個AI賬戶的總資產從初始的約6萬美元增長至14萬美元,漲幅超過130%。具體排名方面,DeepSeek Chat V3.1以1.27萬美元的賬戶餘額暫居首位,Grok4緊隨其後達到1.247萬美元,Claude Sonnet4.5位列第三爲1.0934萬美元。Qwen3Max、GPT5和Gemini2.5Pro分別以9584美元、7552美元和6726美元排在後三位。

從交易策略來看,不同AI模型表現出明顯差異。一些模型傾向於高頻套利操作,另一些則採取長線持倉策略。統一的提示詞設置保證了起點公平,避免了因指令差異導致的結果偏差。實時監控數據顯示,在BTC價格波動期間,多款AI成功捕捉到了短期反彈機會。

這一實驗的技術價值在於提供了AI模型在高不確定性金融場景下的能力對比。加密貨幣市場的24小時連續交易、高波動性和複雜的市場結構,對AI的數據處理速度、風險評估能力和動態適應性提出了嚴峻考驗。DeepSeek的領先表現引發了關於開源模型在金融應用領域競爭力的討論。

該實驗還設置了實時觀戰功能,允許觀衆查看價值曲線和決策日誌,增強了透明度和互動性。這種公開化的測試方式爲AI金融應用的評估提供了新思路。

不過需要指出的是,這類實驗存在明顯的侷限性。首先,1萬美元的資金規模和48小時的測試周期無法充分反映AI在大規模、長週期交易中的表現。其次,加密貨幣市場的極端波動性使得短期收益具有較大隨機性,130%的整體漲幅可能更多歸因於市場行情而非AI能力。此外,統一提示詞雖然保證了公平性,但也限制了各AI模型發揮其獨特優勢的空間。

從風險角度看,AI自主交易面臨的最大挑戰是對黑天鵝事件和市場異常情況的應對能力。這些模型在訓練時可能未充分接觸極端市場場景,在面對突發監管政策、技術故障或市場操縱時的反應能力尚未得到驗證。專家指出,AI交易工具可以提升效率,但關鍵決策環節仍需人類監督。

從行業發展來看,這類公開化的AI競技實驗可能催生更多類似項目,推動AI在量化交易、風險管理等金融細分領域的應用探索。但AI模型從交易輔助工具向獨立決策主體的轉變,仍需要更嚴格的監管框架、更長期的性能驗證和更完善的風險控制機制。