![]()
出品 | 妙投APP
作者 | 段明珠
編輯 | 關雪菁
頭圖 | AI生成
用AI搞投資,全球最頂級的6個 AI 大模型,誰是理論家,誰是實戰派?
要說在國際 AI 圈里, GPT 和 Claude 的熱度絕對更高,但意料之外情理之中的是,當下正在進行的一場金融實戰比賽中,從大A身經百煉鍛煉出的 DS 表現更優異,而 Qwen 的半路超車亦很驚艷。
目前,前兩名分別是幻方 DeepSeek V3.1 Chat 和阿里 Qwen 3 Max,收益率把后面幾位遠遠拋下;在保本線上“掙扎”的是馬斯克的 Grok 4 和 Anthropic 旗下的 Claude 4.5 Sonnet ;一度爆虧70%左右的是谷歌的 Gemini 2.5 Pro 和 OpenAI 開發的 GPT-5,估計比賽剩下時間都要在漫漫回本路上。
這場比賽由美國實驗室 Nof1 啟動,這是家號稱首個專注于金融市場的 AI 實驗室,這次其向六個頂尖的大模型各提供10,000美元的真實資金,讓它們在真實市場中,用真金白銀進行投資比賽。
這本質上是一次針對 AI 模型交易能力的壓力測試,而非單純的市場表現對比。核心在于觀察不同 AI 在真實波動市場中的策略有效性、風險控制及執行紀律。
隨著比賽推進,AI 似乎也展現出不同性格,DS 穩健得像個量化老手,與之形成鮮明對比的是 GPT ,被網友調侃“交易風格神似散戶”;Claude 的謹慎像個保守的基金經理,而 Qwen 則是看準機會就全倉押注一只。
為何這些 AI 表現差異如此巨大?與背后各家平臺有何關系?這場比賽 AI 的決策依據主要是數據技術分析,這對普通投資者的借鑒和警示又是什么?
#01差異從何而來?
先看這些 AI 的具體操作。
這次比賽的規則比較簡單:
6個 AI 各1萬美元用來實時跟進虛擬貨幣永續合約,全天候可實時觀看;
跟蹤標的僅限于6種主流品種;
自行確定策略(倉位、看漲或看跌等);
比賽開始于美東時間10月18日,將持續兩周,于11月3日結束;
勝負標準是風險調整后的收益,不光看賺多少,還得看承擔多大風險。
從開始至今,這場金融實戰比賽已經歷2輪淘汰賽。
![]()
第一波被淘汰的是,Gemini 和 GPT-5。
不得不說這次比賽的時機很好。前不久,全球資本市場剛經歷了黑天鵝事件,所以比賽開始正處于價格相對低點,適合建倉。
開始第一天,各家 AI 落子就顯出差異。
DS 全倉全覆蓋做多,且杠桿在10到15倍,相當于自己設計并持有 A6 指數,且不換手不止損不止盈,只要價格大趨勢上漲,就可躺贏;甚至穩妥起見,還預留了幾千美元現金備用。
Grok開始也是全多頭布局,但交易風格更為激進,收益率和 DS 追得比較近;Claude 分析能力強,但執行卻猶豫不決,經常調倉失敗、反復止損,收益曲線在零軸上下反復。
此時 Qwen、Gemini 和 GPT-5 微虧。但虧損原因大為不同,Qwen 選擇每天押注一個標的,所以小虧小賺,還不顯山露水。
而Gemini 就比較像韭菜,策略漂移,先開空單,但遇到市場反彈,于是平倉,隨即轉為做多,但又同時做空別的……就這樣不斷地開倉平倉,先空后多,搖擺不定;不僅產生高額交易成本,后續還在頻繁交易中錯過主升浪。
舉個簡單的例子,Gemini 的操作相當于在8月“易中天”主升浪的時候,做多中際旭創的同時做空新易盛,過了一天又完全反轉過來。
就這樣 Gemini 成了第一階段損失最大的。
GPT-5 也有同樣問題,只是此時還有 Gemini 給它墊底。
真正拉開差距是在19日下午。DS 和 Grok 開始大漲,而 GPT-5 和 Gemini 掉頭急轉直下。究其原因是跟蹤資本市場在回調后迎來一波強勁反彈,做多的 DS 吃到紅利;而 Gemini 一看到下跌就去做空,結果在這波拉升中爆虧,虧損率超40%。
第二波被淘汰的是,Grok 和 Claude。當然,如今它倆的收益曲線回升到零軸以上;難過的是早被淘汰的兩個在這波中被甩得更遠,尤其是 GPT-5 虧損率最高時超過75%,比賽期間幾乎難以翻身。
當市場迎來一次更深的回調,所有模型也在22日凌晨經歷了一次大跌。期間 Claude 直接從賺到賠,Grok 也回吐完盈利開始一路下滑;DS 的穩健此時發揮了作用,僅微虧一點很快又開始賺錢。
有意思的是,Grok 持倉中分給更依賴馬斯克敘事紅利的虛擬資產更多份額,但這種缺乏基本面支撐,一旦市場情緒退潮便快速回吐收益。
反觀 GPT-5 和 Gemini ,兩者都對走勢判斷完全錯誤,在這次回調中越跌越深,而在后續反彈時因本金虧損過多,又過于謹慎(一度空出近一半資金)而回血很慢。類似于下跌時重倉出擊,上漲時唯唯諾諾。算筆賬,如果投資先虧了50%,需要賺100%才能回本,難度倍增。
這階段 GPT-5 成了墊底的。原因從其經典語錄中可看出一二:“虧了72%手頭只剩$1458, 我本來想拿**做一單,但瞅了瞅行情,感覺指標不太妙有下跌的可能,而且最近交易有點太頻繁了,所以最后還是決定不做了。現在我主要得把手頭每個單子的止損點和盈利目標都好好記下來。”
異軍突起的是阿里 Qwen。22日傍晚起,阿里 Qwen 的收益曲線陡然上升,并快速超越 DS 成為新王(后又被 DS 超越,但仍在第二位)。看操作,Qwen 反超是看到上漲信號,直接滿倉高倍杠桿做多最強的虛擬資產;且賬戶可用現金基本不到100美元,不留操作空間,猛猛all in。
Qwen 的經典語錄是:“總盤子一萬二千五,現在浮盈差不多25%了,還有97刀現金。我那個20倍的**多單還拿著呢,已經想好怎么溜了。數據顯示這波還能漲,必須跟上節奏。”
27日 DS 再次超過 Qwen ,自此,6個頂級 AI 模型的位次基本穩定。目前在預測網站上,44%的投票者認為阿里 Qwen 會贏下比賽,緊隨其后的是 DS ,投票率在35%。誰能最終勝出還有懸念,但對于誰會輸掉比賽,大家的共識度更高,有高達60%的人認為 GPT-5 會是最后的失敗者。
![]()
#02中國隊勝出原因分析
要明確的是,這次 AI 大賽與以往最大的不同是,讓 AI 們直面真實、動態、復雜甚至混亂的虛擬幣市場。
事實上,佛羅里達大學研究人員曾讓 GPT 回測2021年10月至2022年12月的數據,這期間其驅動的交易模型收益率超過500%, 而同期標準普爾500指數 ETF 回報率是-12%。
但此次比賽中,恰恰 GPT-5 是表現最差的那個。這說明,實踐是檢驗真理的唯一標準,“市場是檢測AI智能的終極測試”。
在真實的交易場景中,或許光有強大的語言能力是不夠的,對市場的理解更加重要。每一秒的價格都在變化,沒有標準答案只有盈虧。更重要的是,這類市場是典型的零和博弈,你賺的錢就是別人虧的錢。
![]()
時間截止:北京時間2025年10月28日15點16分
從目前統計數據可見:
Gemini 的問題在于頻繁交易,小贏大虧。交易次數上排在第二的GPT-5也僅趕上它的零頭;這樣的壞處是頻繁操作加劇了滑點(實際成交價格與預設掛單價格的偏差)和手續費損耗。從勝率來看,其表現不算最差,但最大一次收益金額約為最大損失的一半,可簡單看為賺1塊錢得賠出去2塊。
GPT-5 也存在頻繁交易和小贏大虧的問題,雪上加霜的是,勝率還低。其“賭徒式”決策風格、多空雙虧的策略矛盾,加上未為頭寸設置止損線,導致其多次爆虧,嚴重侵蝕本金。其就如同“想得太多的分析師,處處下注卻處處被打臉”。
Claude過于謹小慎微,善于分析;雖然勝率較高,風險管理得當,但在趨勢明確的市場中,保守反而成了包袱。
Grok試圖捕捉多個機會,但勝率一般;如前面所提,不知是否和出身相關,其對同樣與馬斯克有密切關系的虛擬幣“情有獨鐘”,很難說是不是因為這而拖累了表現。
再看表現最好的兩只中國隊。
DS 明顯是均衡穩健派,波動曲線更平穩;夏普比率是參賽 AI 中最高的,意味著其用最小的風險換最優的回報,是專業選手。
它的交易期望值遠高于 Qwen ,這個指標可理解為:“平均下來,每做一次交易,我預計能賺多少錢?”這意味著,DS 交易策略在統計上更為穩健,其盈利的可復制性和質量遠高于 Qwen。這大概也能解釋為何后來其又能再次超過 Qwen 。
同時,DS 的平均持倉時間至今長達49小時,這表明它可能識別到所持資產處于上升趨勢,并堅定地執行了看漲策略。
DS 的經典語錄:我正乘著市場上漲的浪潮,持有倉位,因為它們都處于盈利狀態,并且沒有觸發任何失效條件。我的賬戶價值從 10,000 美元的起始值上漲至 13,745.78 美元,總回報率高達 37.46%。
最后看 Qwen,市面上對它的評價也比較兩極,看好的說它“好像有交易員的直覺,知道何時該等,何時該動”,不看好的會認為它是“孤注一擲的大賭徒”。
從數據來看,其80%以上的收益來自一筆多頭交易,而夏普率為0.338,這表明其高收益是通過承受極高的波動性和風險換來的。這更像是一種高“Beta”(市場風險)暴露,而非穩定的“Alpha”。
這次 Qwen 的爆發得益于兩個因素:下注時機精妙;選擇正確的資產和方向。其勝率在所有 AI 模型中最高,但因為時間較短,策略還需要繼續得到驗證。“真正的Alpha應體現在持續超越市場基準的能力,而非短期爆發力。”
不同 AI 對風險和收益的平衡完全不同,訓練數據的影響可能是關鍵。
Deepseek背后的幻方量化,十幾年來在堪稱“地獄級”難度的大A市場積累了海量的交易數據和策略,且真正賺了錢;這些數據即使不直接用于訓練,可能也會影響對“什么是好的交易決策”的理解。
相比之下,OpenAI 和 Google 的訓練數據可能更偏向學術論文和網絡文本,對實盤交易的理解不夠接地氣。
同時,有交易員推測,DS 可能在訓練時特別優化了時間序列預測能力,而 GPT-5 可能更擅長處理自然語言。在面對價格圖表這種結構化數據時,不同的架構會有不同的表現。
#03AI 該如何幫助投資?
從這些 AI 的操作可得到的直接經驗是:
首先,從長期投資的角度,如果沒有信心成為千萬分之一的頂尖交易員,DS 的多頭分散策略更具可持續性;普通投資者要避免過度交易,且謹慎使用杠桿,因為即使是頂級AI,在高杠桿下也隨時可能破產。
其次,若判斷市場處于上行大周期,就應學會忽略中途的小幅震蕩。相比頻繁交易,在“牛市”中穩持反而是更優解。
那么,將投資交給AI真的靠譜嗎?
顯然,看到這次 GPT-5 的表現,國外交易員可以松口氣,他們暫時不會被 AI 取代;而看到 DS 和 Qwen 的表現,大A的散戶們可能會心中一寒,對手太厲害。
客觀來看,AI 的優勢在于理性,它不會情緒化,也不會貪婪或恐懼。它能在極短時間內讀完海量報告、理清邏輯鏈條,提供結構化的判斷。
但它的短板同樣明顯:無法預測未來,也難以捕捉市場的動態博弈與隱性信號;面對宏觀突發與黑天鵝事件,它的反應往往滯后。
所以關鍵是,如何運用好 AI 來幫助投資。
事實上,過去一年里,已經有人依靠 AI 推薦選股并取得了真實收益。但前提是:這些用戶本身就具備較強的投資素養,能夠提供專業的提示詞,如自身風險偏好、目標收益區間,讓 AI 分析財報、估值、波動率與趨勢等,再生成針對不同市場的個性化策略。
換句話說,能高效用好 AI 的人,本身已經是成熟投資者,AI只是他們的決策輔助工具。
金融市場確實是下一個 AI 時代的最佳訓練環境。未來,理性的工具與人的智慧相結合,或許才是最佳交易策略。
*以上分析討論僅供參考,不構成任何投資建議。
———? 妙投行業研究交流群? ———
上證指數一路狂飆突破 3800 點,可多數散戶的賬戶卻沒啥起色,問題出在了哪兒?
一是板塊輪動節奏難把握,二是信息獲取不及時。
別著急,妙投社群有專業的投研團隊,實時解讀股市動態,為你的投資決策提供有力依據。長按下方圖片二維碼可立即加入
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.