![]()
作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com
AlphaGo戰勝李世石時,人們驚嘆AI在封閉規則下的完美表現。但在真實世界遠比圍棋盤復雜,市場有噪音、有情緒、有不可預測的黑天鵝。AI能在這樣的環境中生存嗎?一場名為“Alpha Arena”的實驗希望給出答案:讓AI用真錢、在真實市場中、完全自主地交易加密貨幣。
這不是模擬,而是真刀真槍的較量。
截至10月20日下午6點,在這場已經持續三天的AI交易大賽中,排名前三的分別是DeepSeek:賬戶價值沖到14150美元,三天盈利超40%。Grok緊隨其后:收益率36%。Claude Sonnet 4.5排名第三,盈利24%。
有網友已經開始在線求助:“怎么讓DeepSeek操作我的股票賬戶”
真金白銀的AI交易大賽
這場比賽由金融市場的AI研究實驗室nof1發起,于當地時間10月17日啟動了一項名為Alpha Arena的大模型交易測試。選取了6個主流AI大模型:GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek Chat V3.1、Qwen3 Max,每個模型在去中心化交易所Hyperliquid上獲得10000美元的真實USDC資金。
規則簡單粗暴,所有模型使用相同的輸入數據和提示詞,需要自主完成策略生成、倉位管理、時機選擇和風險控制。沒有人工干預,沒有后悔藥。所有交易決策完全透明公開,任何人都可以在nof1.ai網站上實時查看每一筆交易。
![]()
當前排行榜,DeepSeek和Grok領先
早在10月11日,項目還在測試時期就獲得了馬斯克的關注,1馬斯克在X上轉發了項目創始人Jay Azhang的推文,配文只有簡單的Grok,Grok在測試中表現突出。
![]()
“Grok4目前領先。它先做空,然后翻轉為多頭,時機把握完美。”
項目在10月10日首先進行了小規模實驗,給6個AI模型各200美元進行交易測試。第一天Grok-4的表現就讓所有人震驚:單日漲幅超過500%。
10月14日,測試規模升級到每個模型10000美元。有趣的是,這些AI模型立即展現出激進的交易風格,毫不猶豫地開出了巨大倉位。
![]()
10月16日,項目創始人Jay_azhang,發布短視頻《Are you ready for Alpha Arena?》,正式拋出 “Alpha Arena” 概念,一個規模更大、賭注更高的實驗。視頻首先展示了初步實驗的結果,他們給了6個不同的人工智能模型各200美元進行交易,結果在一天內就取得了高達77.9%的集體回報率。視頻也展示了并非所有模型都賺錢,有的盈利,有的虧損。
![]()
10月17日晚,Alpha Arena直播正式上線。新一輪測試正式開始,6個AI模型完全自主交易真實市場,可以自主下單、平倉、使用杠桿,所有收益按"已平倉利潤"計入排行榜。
比賽前兩天,所有模型都在1萬美元上下震蕩,謹慎試探市場。但到了10月19日下午,市場突然爆發,各AI模型的命運開始急劇分化。
![]()
從走勢圖可以清晰看到分水嶺的出現:DeepSeek(藍線)和Grok(黑線)在關鍵時刻果斷做多,賬戶價值從1萬美元直線飆升;而Gemini(藍底線)和GPT-5(綠線)則在暴漲行情中崩盤,從1萬跌至7千附近。到10月20日早間,6個模型合計資產已從60000美元沖到約140000美元,整體回報率超過130%。
截至當前,排行榜格局已經非常清晰,DeepSeek Chat V3.1以+41.81%的收益率領跑,賬戶價值14,181美元,更令人印象深刻的是它僅用6筆交易就實現了這一收益。Grok-4更加極端,只下了1筆交易就豪賺37.65%,手續費只有9.18美元。Claude Sonnet 4.5以+24.59%排第三,5筆交易中抓住了最大單筆盈利1807美元,夏普比率是0.026,意味著其風險調整后的收益表現在所有模型中最佳。
![]()
相比之下,GPT-5和Gemini則表現非常差,分別虧損25.4%和29.03%。Gemini尤其慘烈——46筆交易產生的439.30美元手續費幾乎吃掉了三分之一本金,成為過度交易的反面教材。
從持倉來看,獲勝的模型普遍持有主流幣種的多頭倉位,這也印證了它們在10月19日市場暴漲前果斷做多的策略。
![]()
![]()
![]()
![]()
![]()
“出身”決定命運?
一個有趣的點是,不同AI模型在交易中展現出了截然不同的"性格"。DeepSeek和Grok能夠脫穎而出,背后可能有一些值得分析的原因。
DeepSeek背后的幻方本身就是一家量化對沖基金,使用AI算法進行交易決策。這意味著DeepSeek從誕生之日起可能就浸潤在金融數據和交易邏輯中。它的6筆交易展現出明顯的量化特征,不是靠運氣,而是靠概率和紀律。
Grok背后是馬斯克的xAI,它有一個獨特優勢就是對X的實時分析。在加密貨幣市場中,社交媒體情緒往往是價格變動的先行指標。有網友就自稱從今年5月開始就用Grok輔助交易期權,目前收益已達1100%。
![]()
網友稱用Grok交易期權收益超1100%
一場AI“真人秀”
nof1.ai自稱為首個專注金融市場的AI研究實驗室,根據其個人主頁信息,創始人Jay Azhang常駐紐約,背景橫跨工程、金融與生物學。他曾在摩根大通擔任量化分析師,負責exotic options(奇異期權)定價。之后他加入獨立石油貿易商Vitol Group,擔任首席量化分析師。據他LinkedIn顯示,他是Vitol“最年輕的初級交易員”,之后聯合創辦了視頻流媒體公司Krue,2018年創辦單人GP運營的基金,在約4年時間內實現了6倍回報。2025年創辦“隱秘初創公司“,大概率就是nof1.ai,目標是把AI研究直接對接金融市場。
區塊鏈媒體CoinTelegraph曾在2022年的報道中將Jay描述為Web3創業家,當時他用ChatGPT寫了一首"關于在加密貨幣中虧錢的歌詞",頗具自嘲意味。另一位聯合創始人Matthew Siper是紐約大學機器學習方向的博士候選人,同時也是AI研究科學家。一個還沒畢業的博士生做項目,這更像是一個驗證學術假設的實驗。
從團隊背景來看,nof1并不是純粹的商業炒作。Jay本人具備量化交易經驗,他很清楚市場的殘酷和AI的局限。Alpha Arena更像是他在問一個問題,既然我自己能用量化策略賺錢,那AI能不能也做到?
![]()
不過,在為這些AI交易員的表現驚嘆之余,也需要保持一些冷靜。Alpha Arena為“讓AI在活市場里跑分”提供了前所未有的公開窗口,但作為基準測試,它仍然缺乏大樣本、長時間、跨市場的數據積累,缺乏透明、可復現的輸入與運行設置。換句話說,它更像一場極具觀賞性的“鏈上真人秀”,而不是能直接指導模型選型或金融生產的嚴格Benchmark。
值得注意的一點是,官方目前只強調統一Prompt + 統一輸入的賽制設定,并未對外公布完整的Prompt文本。這意味著我們無法完全復現這些AI的決策過程。
但不管怎樣,這場實驗已經證明,AI已經具備在真實市場中交易能力的跡象,量化交易公司已經在試圖借助AI來幫助自己更好的交易,也許也許真正的問題不是AI能否交易,而是我們準備好迎接AI交易員了嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.