![]()
作者:星海老局
來源:星海情報局(ID:junwu2333)
1956年,美國商人麥克萊恩發明了集裝箱。
在集裝箱之前,貨物出口靠的是人力散裝,一件一件靠叉車、吊機搬運,一船要裝卸好幾天,運輸成本里有一半是裝卸費。集裝箱的出現,讓這一切變了——任何貨物,只要裝進箱子,就能被任何港口的吊車裝卸,被任何貨輪運輸,被任何買家接收。
簡單的發明,卻帶來了非凡的效益:它讓全球貿易的摩擦成本大幅下降,當中國成為“世界工廠”后,中國產能借著集裝箱滲透到了全球的每一個角落。
七十年后,一個新的“集裝箱”出現了,而這個新的“集裝箱”叫Token。
Token是大語言模型處理文字的最小單位,大致相當于半個中文字。但它的意義不在于這個技術定義,而在于它做到了和集裝箱一樣的事:把原本難以計量、難以交易的東西——智能服務——裝進了一個標準化的容器。
一個問題、一段代碼、一篇文章,背后消耗了多少算力,全部可以用Token來計量、定價、交易。就像集裝箱讓任何貨物都能被吊車裝卸,Token讓任何智能服務都能被API調用、被計費、被出口。
中國第一次有機會大規模出口腦力,而不是體力、礦產、能源。美國人掀起了這場AI浪潮,定義了規則,炒高了價格,卻沒想到,Token這門生意的霸主,正在悄悄換人。
01
Token:智能時代的標準化集裝箱
Token,翻譯過來叫詞元,是大語言模型處理文本的最小單位。
「我喜歡吃蘋果」,對人類來說是一個完整的句子。對AI來說,它是「我」「喜歡」「吃」「蘋果」四個Token。英文更復雜,「ChatGPT」會被拆成「Chat」「G」「PT」三個Token。
這種拆分看起來瑣碎,但它讓智能服務第一次變得可以量化,可以被公平地計算,就像集裝箱一般,Token讓任何智能服務都能被計量、被交易、被出口。
一個印度的創業者,打開電腦,調用DeepSeek的API,讓它幫他寫一段Python代碼。他等了不到一秒,代碼出現了。他付了幾分錢,關上電腦。
這個動作很簡單,但背后發生的事情卻改寫了游戲規則:他的請求通過光纖傳到了中國某個數據中心,數百塊GPU同時啟動,開始逐字生成那段代碼。
每生成一個字,就要消耗若干Token,而每個Token背后,卻是真實的電力消耗。甘肅的風電、青海的光伏、云南的水電,在這一刻以Token的形式,打包跨越國境,變成印度程序員眼前的一行代碼。
中印之間沒有特高壓輸電線路,但中國的電力,卻實實在在被國外消費了。
這就是Token出口的本質:數據中心燒電,GPU運算,產出Token,賣給全球用戶。電力和算力被隱形地打包進每一個Token,隨著API調用流向世界各地。買家買到的是智能服務,但他們實際上消費的,是中國的電力、算力和工程師的智識積累。
這個機制有一個關鍵的特性:它不需要買家在地理上靠近中國,不需要鋪設任何物理管道,只需要一根網線。這是傳統電力出口永遠做不到的事。
中國電力之強大,天下人所共知,2025年,中國光伏裝機突破3.15億千瓦,占全國新增發電裝機的57%。
但裝機越快,消納越難,全國新能源消納監測預警中心的數據顯示:2025年上半年,全國光伏棄電率升至6.6%,風電棄電率5.7%,比2024年同期幾乎翻倍。
西部省份的困境尤其嚴重:2025年1月至11月,西藏光伏發電利用率僅65.8%,甘肅89.6%,青海83.5%,西藏風電利用率更只有69.3%。大量可再生能源發出來,卻沒有地方消納,白白浪費。
其實浪費了都算好的,帶來的電網波動才是真的難頂。
面對這些過剩的電,最直覺的想法是:直接出口出去不就行了?
嘿嘿,想法不錯,但現實沒那么簡單。
電不能裝箱,不能儲存,只能靠實體電網點對點輸送。中國西部棄風棄光最嚴重的地方——西藏、甘肅、內蒙古——偏偏與電網基礎設施最薄弱的國家接壤,放眼中國周圍,基本上沒幾個國家擁有全國性的靠譜電網。
云南通過21條輸電線路與越南、緬甸、老撾聯網,十三五期間累計跨境交易電量176億千瓦時——相比中國每年數萬億千瓦時的總發電量,這個數字幾乎可以忽略不計。
再說了,人家窮國也是有主權的,沒有人愿意讓本國電力依賴鄰國供應,即便愿意把靈魂賣給東大,一度電出口也就五毛錢左右,扣除損耗和交易成本,根本賺不到幾個錢。
因此,傳統電力出口的天花板清晰可見,而且幾乎無解。
但是,如果我們能把電力換個皮,那情況就好辦得多了。
這就是Token的出口——不需要物理電網,不受電力主權約束,價格不被大宗商品市場錨定。這是一條真正可以規模化的新路。
數據中心對電價敏感、對位置不敏感——光纖可以跨越千山萬水。西藏、甘肅、青海的過剩綠電,可以通過數據中心轉化為Token,出口到全球。
這一點,在ToC的市場上尤其意義重大——Toc的意義在于它是最敏感的風向標。中國個人用戶的AI使用習慣正在發生結構性轉變:從「問答」轉向「干活」。編程、寫作、長文檔處理,每一類場景的Token消耗都遠高于簡單對話。加上深度推理模式的普及,單個用戶單次調用的Token量在快速膨脹——業界把這個現象稱為「Token通脹」。
數字印證了這個趨勢。國家數據局數據顯示,2024年初中國日均Token消耗量為1000億,到2025年6月底已突破30萬億,一年半時間增長了300倍。2025年上半年,中國公有云大模型調用總量達到537萬億Token,較2024年全年增長近400%。這個增速,遠超任何一個傳統行業的成長曲線。土壤已經肥沃,種子正在發芽。
中國的澎湃電力,正在套上Token外皮,被國內外市場無形卻又瘋狂購買。
02
賣Token,是一門暴利生意
其實,“電力換皮出口”這事兒,中國早有先例。
中國是全球最大的電解鋁生產國,但鋁土礦本身大量依賴進口——幾內亞、澳大利亞、印度尼西亞的礦石,漂洋過海運到中國,在西南、西北的電解鋁工廠里,經過高耗電的冶煉工序,變成鋁錠,再出口到全球。
礦石是進口的,鋁錠是出口的,而最耗電的那個環節,留在了國內。
也就是說,中國出口的鋁錠里,有相當一部分是電力在換皮出售。只是,這種方式增值倍數不高,一度電變成鋁錠,大約只能增值2到3倍。
生產1噸電解鋁,行業平均耗電約13500度,也就是說1度電大約能煉出73克鋁。鋁錠目前的市場價大約是每噸2萬元,73克鋁價值約1.46元。而這1度電,買入價不過0.3到0.4元。
粗算下來,1度電通過煉鋁增值了3到5倍。
多晶硅也是同樣的邏輯,而且更為典型。
生產1噸多晶硅,綜合電耗約57000度,也就是說1度電大約能生產17.5克多晶硅。目前多晶硅現貨價格約在4萬元每噸,17.5克價值約0.7元。同樣1度電的買入價約0.3到0.35元,煉出多晶硅后增值約2倍。
看起來比電解鋁還低,但這是因為多晶硅行業目前嚴重過剩,2022年高點的時候,17.5克多晶硅可是能賣5元以上的,可以增值10倍。
但是如果你把電力換皮成Token賣出去,那情況可就完全不同了。
H100 GPU在推理場景下,每Token約消耗0.39焦耳,一度電則是360萬焦耳,理論上可產出約920萬Token,考慮到散熱、網絡、冗余等損耗,保守估算一度電實際產出約550萬Token。
Token賣多少錢?DeepSeek輸出定價每百萬Token約2元,OpenAI的GPT-4o定價每百萬Token約70元。
一度電直接出口,賣0.5元,煉成鋁錠賣出去是1.5元,而喂給數據中心跑推理,按DeepSeek的定價,能賣出約11元,是直接賣電的22倍。
更重要的是,鋁錠和多晶硅的工藝早已固定,早就碰到天花板了,但AI還年輕。
Token,是中國迄今為止電力增值效率最高的出口形態。
甚至,這看似暴利的“22倍”系數,還是我們廠商競爭過于激烈、主動壓價的結果,不是能力天花板。
DeepSeek在打市場、搶份額,定價是戰略選擇。DeepSeek-V3的訓練成本僅約3900萬元,用的是H800芯片——國產模型的真實成本,比這個定價還要低得多。即使把價格壓到OpenAI的1/20,中國模型依然有利潤空間。這就是便宜背后的底氣。
03
為什么中國只能賣22倍,
美國能賣785倍
說完了中國這邊的賬,再看看美國那邊的賬。
如果說中國Token出口是暴利,那么美國Token的出口則堪稱是“無本萬利”——Deepseek用一度電轉化出的Token可以賣11元,如果換成OpenAI的定價,同樣則能賣約385元,增值倍數來到了恐怖的“785倍”。
22倍和785倍之間,差著一個數量級。
為什么中國模型的定價,只有美國模型的1/20到1/30?
最直接的原因是品牌溢價缺失。
這就好比同樣是礦泉水,農夫山泉賣2塊,依云賣30塊,不是因為依云的水分子更高級,而是因為它賣的是阿爾卑斯山泉這個故事。
OpenAI也是同樣的道理——它賣的不只是Token,賣的是全球最強AI這個認知。這個認知本身值錢,而且能讓人愿意為之多付錢。
Claude Sonnet輸出定價每百萬Token約105元,MiniMax M2.5只要約8元,相差13倍。
用戶愿意為Claude買單,不只是因為Claude測試結果優異,還因為他們相信Claude確實更好——你怎么樣是一回事,領導怎么看你,是另外一回事。
中國模型廠商目前還處于農夫山泉的階段,價格透明、童叟無欺,但品牌故事還沒講出來。
其次是模型能力的差距。
DeepSeek在數學、編程的基準測試上已經追平甚至超越OpenAI,但基準測試是考場,生產環境是戰場。
在實際的企業應用里,穩定性、指令遵循的精確度、邊緣情況的處理才是核心。實際的能力差距,直接影響定價天花板——你能解決別人解決不了的問題,才有資格開更高的價。中國模型目前還在追趕高端場景,這個差距縮小一分,定價空間就能打開一分。
第三,則是生態和信任的缺失。
企業客戶選AI供應商,就像選銀行,不只看利率,還要看這家銀行會不會突然倒閉、出了問題有沒有人接電話。
OpenAI和微軟Azure背后有完整的企業服務體系——SLA保障、合規支持、技術文檔、售后響應,這套東西是多年積累下來的信任背書。中國模型在工程能力上完全不輸,但這套售后體系還在建設中。
![]()
畢竟,歐美在SaaS這塊可是玩兒了幾十年的,熟練程度和在珠三角找五金廠一個感覺。
最后還有一道隱形的壓力:地緣政治折扣。
簡單說就是,很多客戶想用但不敢用,或者用了也要壓價,因為心里有顧慮——今天能調的API,明天會不會被自己國家的監管叫停?美國聯邦機構禁用DeepSeek,德國要求下架,這些新聞每出一條,都會讓潛在客戶的決策再遲疑一下。遲疑折算成價格,就是折扣。
四個原因疊加,形成了一種結構性的定價壓制。
22倍是現在的成績,不是終點。但從22倍走向更高,靠的不是更猛的降價,而是品牌、能力、生態、信任一點一點地積累。
短期內,最明顯的障礙是西方封禁,歐美對中國高科技的打壓始終沒停過,這是咱們早就有的心理預期——今天一個法案,明天一個禁令,早就虱子多了不嫌咬了。
但說實話,這些封禁更像是在門口立了個牌子,而不是真的堵死了路。
中國Token出口的主戰場從來不是西方發達國家,而是印度、東南亞、拉美、中東——也就是全球南方。DeepSeek在印度、東南亞的擴張沒有受到太大影響。封禁反而幫中國模型做了廣告:被美國封殺的產品,一定有點東西。
真正危險的,其實是內部問題——國內模型廠商,也開始價格戰了。
2024年,字節豆包報價低到每千Token不到0.006元,阿里通義千問GPT-4級主力模型降價97%,智譜把上一代GLM-4-Plus砍了90%。這場價格戰打得像菜市場收攤前甩賣,贏得了用戶,卻虧掉了利潤,壓縮了再投資能力。
好在2025年情況開始逆轉:智譜GLM-5發布當天宣布漲價30%,Kimi K2.5發布不到一個月,海外收入首次超過國內。漲價能成功,說明需求是真實的,市場在成熟。但價格戰留下的諸多后遺癥卻需要時間消化。
長期來看,有兩個結構性問題懸在中國AI的頭頂。
第一是算力天花板。
芯片禁令不會消失,美國必然會管得越來越嚴。DeepSeek用H800訓練出了頂級模型,這是一次了不起的工程奇跡,但奇跡不能當戰略。就像一支球隊贏了一場經典戰役,不代表它永遠能以少勝多。下一代模型如果需要十萬張H100,而中國只能拿到性能打折的替代品,訓練成本優勢就會被侵蝕。
不過,現在情況應該好了不少,老黃這次來國內拜訪一圈,結果好像一張H200都沒賣出去。
第二個長期問題是數據本地化壓力。
各國對數據主權的限制也在越發收緊,歐盟的GDPR、印度數據本地化法案、中東的合規要求,都在往同一個方向推。
目前中國Token出口依賴的是純境外API調用模式,一旦各國要求數據不能出境,就得在當地建數據中心。可若是在本地建中心,那么土地、電力、運維全部按當地標準來,成本結構就完全變了,也就不那么“便宜”了。
因此,Token出口的終極形態,可能不是簡單的API調用,而是中國技術加本地部署——這對商業模式和運營能力,都是更高的要求。
不論如何,還是要感謝美國AI——感謝他們用真金白銀和大喇叭宣傳,幫中國找到了電力出口的正確姿勢。
OpenAI、Anthropic把Token價格錨定在高位,教育了市場,激活了需求,卻讓更多企業用不起。中國模型以1/20的價格提供80%的能力,填補了這塊空白。
從賣電到賣Token,中國完成了從體力活到腦力活的躍遷——不需要密集勞動、不需要污染環境、不需要物理電網,不受地緣政治的電力主權約束,價格也不再被大宗商品市場錨定,這是一條真正意義上可以規模化的新路。
美國負責把Token價格炒上去,中國負責把Token價格打下來,“西數東算”的博弈,才剛剛開始。
THE END
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.