網易首頁 > 網易號 > 正文申請入駐

AI實盤操作，DeepSeek暴賺，Gemini崩盤，網友：專業對口就是不一樣

2025-10-20 20:38:41　來源: 硅星GenAI

上海舉報

分享至

作者｜周一笑
郵箱｜ zhouyixiao@pingwest.com

AlphaGo戰勝李世石時，人們驚嘆AI在封閉規則下的完美表現。但在真實世界遠比圍棋盤復雜，市場有噪音、有情緒、有不可預測的黑天鵝。AI能在這樣的環境中生存嗎？一場名為“Alpha Arena”的實驗希望給出答案：讓AI用真錢、在真實市場中、完全自主地交易加密貨幣。

這不是模擬，而是真刀真槍的較量。

截至10月20日下午6點，在這場已經持續三天的AI交易大賽中，排名前三的分別是DeepSeek：賬戶價值沖到14150美元，三天盈利超40%。Grok緊隨其后：收益率36%。Claude Sonnet 4.5排名第三，盈利24%。

有網友已經開始在線求助：“怎么讓DeepSeek操作我的股票賬戶”

真金白銀的AI交易大賽

這場比賽由金融市場的AI研究實驗室nof1發起，于當地時間10月17日啟動了一項名為Alpha Arena的大模型交易測試。選取了6個主流AI大模型：GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek Chat V3.1、Qwen3 Max，每個模型在去中心化交易所Hyperliquid上獲得10000美元的真實USDC資金。

規則簡單粗暴，所有模型使用相同的輸入數據和提示詞，需要自主完成策略生成、倉位管理、時機選擇和風險控制。沒有人工干預，沒有后悔藥。所有交易決策完全透明公開，任何人都可以在nof1.ai網站上實時查看每一筆交易。

當前排行榜，DeepSeek和Grok領先

早在10月11日，項目還在測試時期就獲得了馬斯克的關注，1馬斯克在X上轉發了項目創始人Jay Azhang的推文，配文只有簡單的Grok，Grok在測試中表現突出。

“Grok4目前領先。它先做空，然后翻轉為多頭，時機把握完美。”

項目在10月10日首先進行了小規模實驗，給6個AI模型各200美元進行交易測試。第一天Grok-4的表現就讓所有人震驚：單日漲幅超過500%。

10月14日，測試規模升級到每個模型10000美元。有趣的是，這些AI模型立即展現出激進的交易風格，毫不猶豫地開出了巨大倉位。

10月16日，項目創始人Jay_azhang，發布短視頻《Are you ready for Alpha Arena?》，正式拋出 “Alpha Arena” 概念，一個規模更大、賭注更高的實驗。視頻首先展示了初步實驗的結果，他們給了6個不同的人工智能模型各200美元進行交易，結果在一天內就取得了高達77.9%的集體回報率。視頻也展示了并非所有模型都賺錢，有的盈利，有的虧損。

10月17日晚，Alpha Arena直播正式上線。新一輪測試正式開始，6個AI模型完全自主交易真實市場，可以自主下單、平倉、使用杠桿，所有收益按"已平倉利潤"計入排行榜。

比賽前兩天，所有模型都在1萬美元上下震蕩，謹慎試探市場。但到了10月19日下午，市場突然爆發，各AI模型的命運開始急劇分化。

從走勢圖可以清晰看到分水嶺的出現：DeepSeek（藍線）和Grok（黑線）在關鍵時刻果斷做多，賬戶價值從1萬美元直線飆升；而Gemini（藍底線）和GPT-5（綠線）則在暴漲行情中崩盤，從1萬跌至7千附近。到10月20日早間，6個模型合計資產已從60000美元沖到約140000美元，整體回報率超過130%。

截至當前，排行榜格局已經非常清晰，DeepSeek Chat V3.1以+41.81%的收益率領跑，賬戶價值14,181美元，更令人印象深刻的是它僅用6筆交易就實現了這一收益。Grok-4更加極端，只下了1筆交易就豪賺37.65%，手續費只有9.18美元。Claude Sonnet 4.5以+24.59%排第三，5筆交易中抓住了最大單筆盈利1807美元，夏普比率是0.026，意味著其風險調整后的收益表現在所有模型中最佳。

相比之下，GPT-5和Gemini則表現非常差，分別虧損25.4%和29.03%。Gemini尤其慘烈——46筆交易產生的439.30美元手續費幾乎吃掉了三分之一本金，成為過度交易的反面教材。

從持倉來看，獲勝的模型普遍持有主流幣種的多頭倉位，這也印證了它們在10月19日市場暴漲前果斷做多的策略。

“出身”決定命運？

一個有趣的點是，不同AI模型在交易中展現出了截然不同的"性格"。DeepSeek和Grok能夠脫穎而出，背后可能有一些值得分析的原因。

DeepSeek背后的幻方本身就是一家量化對沖基金，使用AI算法進行交易決策。這意味著DeepSeek從誕生之日起可能就浸潤在金融數據和交易邏輯中。它的6筆交易展現出明顯的量化特征，不是靠運氣，而是靠概率和紀律。

Grok背后是馬斯克的xAI，它有一個獨特優勢就是對X的實時分析。在加密貨幣市場中，社交媒體情緒往往是價格變動的先行指標。有網友就自稱從今年5月開始就用Grok輔助交易期權，目前收益已達1100%。

網友稱用Grok交易期權收益超1100%

一場AI“真人秀”

nof1.ai自稱為首個專注金融市場的AI研究實驗室，根據其個人主頁信息，創始人Jay Azhang常駐紐約，背景橫跨工程、金融與生物學。他曾在摩根大通擔任量化分析師，負責exotic options（奇異期權）定價。之后他加入獨立石油貿易商Vitol Group，擔任首席量化分析師。據他LinkedIn顯示，他是Vitol“最年輕的初級交易員”，之后聯合創辦了視頻流媒體公司Krue，2018年創辦單人GP運營的基金，在約4年時間內實現了6倍回報。2025年創辦“隱秘初創公司“，大概率就是nof1.ai，目標是把AI研究直接對接金融市場。

區塊鏈媒體CoinTelegraph曾在2022年的報道中將Jay描述為Web3創業家，當時他用ChatGPT寫了一首"關于在加密貨幣中虧錢的歌詞"，頗具自嘲意味。另一位聯合創始人Matthew Siper是紐約大學機器學習方向的博士候選人，同時也是AI研究科學家。一個還沒畢業的博士生做項目，這更像是一個驗證學術假設的實驗。

從團隊背景來看，nof1并不是純粹的商業炒作。Jay本人具備量化交易經驗，他很清楚市場的殘酷和AI的局限。Alpha Arena更像是他在問一個問題，既然我自己能用量化策略賺錢，那AI能不能也做到？

不過，在為這些AI交易員的表現驚嘆之余，也需要保持一些冷靜。Alpha Arena為“讓AI在活市場里跑分”提供了前所未有的公開窗口，但作為基準測試，它仍然缺乏大樣本、長時間、跨市場的數據積累，缺乏透明、可復現的輸入與運行設置。換句話說，它更像一場極具觀賞性的“鏈上真人秀”，而不是能直接指導模型選型或金融生產的嚴格Benchmark。

值得注意的一點是，官方目前只強調統一Prompt + 統一輸入的賽制設定，并未對外公布完整的Prompt文本。這意味著我們無法完全復現這些AI的決策過程。

但不管怎樣，這場實驗已經證明，AI已經具備在真實市場中交易能力的跡象，量化交易公司已經在試圖借助AI來幫助自己更好的交易，也許也許真正的問題不是AI能否交易，而是我們準備好迎接AI交易員了嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.