網易首頁 > 網易號 > 正文申請入駐

Token的代價

2026-04-26 23:01:25　來源: 愛因斯

上海舉報

分享至

在工業革命的漫長敘事中，有一個被反復驗證的定律：每當一種新的生產要素變得足夠便宜，它就會像水滲入干涸的河床一般，重塑整個經濟的底層結構。19世紀的鋼鐵如此，20世紀的石油如此，21世紀初的帶寬和存儲空間亦如此。每一次成本曲線的坍塌，都催生出一批前所未有的商業物種。

如今，同樣的故事正在算力領域上演。2026年的硅谷與北京中關村，一場靜悄悄的經濟學革命正在動搖軟件行業數十年來的根基。在過去四十年間，這片土地上的人們篤信一條金科玉律：一旦代碼編寫完成，服務下一個新增用戶的邊際成本幾乎為零。正是這一被稱作「零邊際成本復制」的特性，締造了微軟、谷歌、Meta這些市值以萬億美元計的科技巨頭，也奠定了風險資本對軟件初創企業慷慨解囊的底層邏輯。

然而，隨著生成式人工智能的爆發，這條定律正在以一種幾乎令人措手不及的速度走向失效。當模型的每一次推理都需要消耗真實而昂貴的計算資源時，軟件的邊際成本結構發生了根本性的逆轉。這不僅是一個技術問題，更是一個經濟學問題，一個關于如何在這個新時代創造和捕獲價值的問題。

杰文斯的幽靈

Jevons's Ghost

要理解當前正在發生的一切，需要回溯一個半世紀前的經濟學思想。1865年，英國經濟學家威廉·斯坦利·杰文斯提出了一個看似違背直覺的觀察：蒸汽機的效率在不斷提升，但英國工業對煤炭的消耗卻與日俱增。他的結論是，效率的提高降低了每單位產出所需的成本，而這反過來刺激了更多的消費需求，最終導致總資源消耗不降反升。

這一悖論在今天的AI領域找到了它新的體現。2022年至2026年間，GPT-3.5級別的模型推理成本下降了近280倍，每百萬Token的價格從30美元跌至0.2美元以下。然而，清華大學研究團隊的最新數據顯示，同期OpenAI的推理總支出反而增長了2.4倍（清華大學《Token經濟學全景報告2026》，2026年4月）。當單位成本以兩個數量級的速度墜落時，總賬單卻在攀升，這正是杰文斯悖論在新時代的重演。

原因并不難理解。成本的下降打開了一系列此前在經濟學上根本不可行的應用場景。當圖像生成從每張數美元降至不足一厘時，設計師們開始批量產出方案；當文檔總結從按篇計費變為按Token計費時，每個白領都開始在每個工作日大量使用AI輔助閱讀；當代碼補全從昂貴的專業工具變為程序員的日常伴侶時，開發者們發現自己的產出邊界被大幅拓寬。這些新增需求匯聚在一起，構成了一個吞噬算力的無底洞。

更值得關注的是推理成本在AI企業財務結構中所占的比例正在持續攀升。OpenAI于2026年2月披露的財務數據顯示，2025年其推理成本達到84億美元，占營收比例約47%，導致毛利率從2024年的40%壓縮至33%，遠未達到年初設定的46%的目標。同期Anthropic的毛利率也僅錄得40%，同樣低于預期10個百分點（Anthropic融資披露文件，2026年4月）。當算力成本成為企業利潤最關鍵的變量時，軟件行業傳統的「規模化后實現盈利」的敘事框架正在遭受前所未有的挑戰。

思考的代價

The Cost of Thinking

在當前的AI敘事中，模型的參數量和基準測試分數占據了過多的篇幅，而推理成本這一決定商業模型能否成立的底層變量，卻始終沒有得到與其重要性相稱的關注。這種認知偏差正在讓無數投資人和創業者付出昂貴的學費。

真正將問題推向極致的是Reasoning模型——也就是那些以「深度思考」為賣點的大語言模型的興起。2026年3月的研究數據揭示了一個此前被廣泛忽視的事實：與普通對話場景相比，Reasoning模型的內部推理過程會額外消耗50至600倍的Token。這意味著，當用戶要求模型「仔細思考」某個問題時，他們實際上是在請求一次成本可能高達普通對話數百倍的算力消耗。一個極端的案例顯示，某次Reasoning模型的調用消耗了600個Token，卻僅輸出了兩個英文單詞。對于企業財務而言，這恐怕是商業史上最昂貴的一次數字「沉思」。

這種成本結構對于依賴訂閱制的SaaS企業而言是致命的。以一款提供財報分析的AI助手為例，其前端定價通常沿用SaaS時代的慣性，采用固定月費模式，例如每月收取20美元。然而其后端的成本結構卻是高度波動的——當它吸引到真正的高凈值用戶，即那些每天需要處理數百頁財報的華爾街分析師時，每月的后端API調用成本可能輕易突破50美元甚至更高。這意味著，企業每服務一位重度使用用戶，就要承受長期的現金流凈流出，而這在傳統軟件時代是不可想象的局面。

TikTok視頻分析Agent的案例進一步印證了這一困境。單條視頻的分析成本約為5美元，如果一個專業用戶每天需要分析50條視頻，那么其每日的AI支出就達到250美元，相當于每月7500美元——這是一個足以讓絕大多數企業用戶望而卻步的數字。然而，當用戶愿意為真正創造價值的AI工具支付溢價時，定價權的問題就變得尖銳起來：是按照傳統的座位數收費，還是按照實際消耗的Token計費，抑或是探索其他的商業模式？

分配的殘酷

Cruel Distribution

在一塊蛋糕的切分中，位于最底層的往往掌握著最大的話語權。這條在工業史上被反復驗證的定律，正在AI產業中以新的面貌重演。NVIDIA創始人黃仁勛將AI產業比作一塊五層蛋糕：能源、芯片、基礎設施、模型、應用。每一層都在吞噬上一層的利潤，直到最底層——那些驅動整個系統的發電廠和變電站——成為真正的價值錨點。

能源：沉默的定價者

每一行代碼的執行，每一次Token的生成，都是電子在導體中流動、熱量在散熱器中消散的結果。這意味著，能源不僅是AI的燃料，更是其最根本的成本約束。當一座數據中心每天消耗數十兆瓦電力時，能源供應商便擁有了隱形的定價權——無論上游的模型多先進、應用多精巧，最終都要向電網支付賬單。這種約束并不顯眼，卻決定著整個系統能夠承載的智能規模上限。

芯片：王者的護城河

在能源之上，NVIDIA筑起了當前AI產業中最堅固的壁壘。其最新季度財報顯示毛利率已達75%，這一數字遠超軟件行業的平均水平，也遠超下游的任何競爭對手。原因在于，芯片層是能源轉化為計算的唯一橋梁，而當前能夠大規模生產高端AI芯片的企業屈指可數。當OpenAI和Anthropic在為33%和40%的毛利率苦苦掙扎時，NVIDIA卻能以接近奢侈品的利潤率定價——這不是偶然，而是產業鏈結構的必然結果。

基礎設施：資本密集的鐵幕

芯片之上是基礎設施層——土地、供電系統、冷卻網絡以及將成千上萬處理器編織成一臺超級計算機的工程奇跡。這些就是黃仁勛所定義的「AI工廠」：它們不存儲信息，只生產智能。建設一座萬卡集群的成本已達數十億美元，而折舊與維護進一步侵蝕著利潤空間。這一層的玩家往往是國家資本或超級互聯網企業，它們以規模換取微薄的回報率，卻為整個產業提供了不可或缺的物理底座。

模型：光鮮背后的毛利率之痛

位于基礎設施之上的模型層，是這場AI浪潮中最引人注目的明星。OpenAI和Anthropic的名字頻繁出現在新聞頭條，它們的模型參數動輒千億，估值高達數百億美元。然而，當視線穿透光鮮的估值數字，露出的卻是一幅毛利率承壓的現實圖景。OpenAI 2025年推理成本達84億美元，占營收比例約47%，導致毛利率從2024年的40%壓縮至33%；Anthropic的毛利率也僅錄得40%，低于預期10個百分點（Anthropic融資披露文件，2026年4月）。這種壓力源于上下游：模型公司既需要向上游購買算力，又需要向下游爭奪用戶，夾在中間的它們不得不承受來自兩端的定價擠壓。

更值得關注的是，這種擠壓正在加劇。Anthropic于2026年4月公布的最新數據顯示，其年度經常性收入已從2025年8月的50億美元飆升至300億美元，首次超越OpenAI成為行業收入領頭羊。然而，即便收入增長如此迅猛，毛利率仍持續承壓，這表明整個行業正處于一個尷尬的中間地帶——既沒有享受到純粹基礎設施提供商的定價權，也沒有建立起真正的應用層壁壘。

應用：被上下游夾擊的戰場

最上層的應用本應是價值兌現的舞臺，如今卻成為利潤最稀薄的戰場。NVIDIA最新發布的Blackwell平臺數據揭示了一個場景：在醫療、游戲、客服等垂直場景中，推理成本的優化幅度動輒達到4至6倍（NVIDIA Blackwell平臺發布，2026年2月）。這些數字既展示了技術進步帶來的成本下降空間，也暗示了一個不可逆轉的趨勢——應用層的競爭正在將節約下來的成本轉移給上下游，而自身難以留存超額利潤。

當然，并非所有應用都處于相同的困境。Anysphere旗下的Cursor編程助手目前年度經常性收入已達5億美元，估值99億美元；Cognition旗下的Devin估值40億美元。這些公司的共同特點是高度聚焦于一個具體場景——代碼生成與編程輔助，并且已經積累了相當規模的付費用戶群體。Anthropic披露的數據顯示，其Claude Code產品60%以上的收入來自API調用，編程成為目前AI垂直應用中最成熟的商業模式。當AI能夠替代昂貴的專業人力時，其創造的價值便足以支撐健康的利潤率。

夾縫中的生存法則

黃仁勛的蛋糕比喻描述了一個產業的價值鏈的特點：在AI的價值鏈中，越靠近底層，定價權越穩固；越靠近上層，競爭越激烈，利潤越稀薄。能源決定著系統的物理上限，芯片把控著轉化的咽喉，基礎設施消耗著驚人的資本，應用則被上下游雙重擠壓。

在這個結構中，唯一可能的例外是那些真正解決了「最后一公里」問題的垂直應用——它們之所以能夠存活，不是因為上游的施舍，而是因為它們直接替代了昂貴的專業人力，從而截留了價值轉移的通道。

對于整個產業而言，這意味著未來十年的競爭將不再僅僅是模型的軍備競賽，更是對價值鏈位置的戰略抉擇。選擇芯片層意味著與NVIDIA正面競爭；選擇模型層意味著接受夾心餅干的命運；選擇應用層則需要在垂直場景中建立足夠深的護城河。

而那些無法在這個鏈條中找到自己位置的企業，將不可避免地成為他人蛋糕上的糖霜——看似甜美，實則隨時可能被抹去。

中國式的例外

The China's Exception

將目光轉向中國市場，會看到一幅更加復雜、也更加令人困惑的畫面。

國家數據局于2026年4月發布的統計數據顯示，2024年全年中國的Token調用量為114萬億，而僅僅半年后的2025年上半年，這一數字就激增至537萬億。更令人震驚的是2026年3月的數據：日均調用量已達140萬億，以此推算單月調用量約為4200萬億，是2024年全年的37倍。這一增速在全球范圍內幾乎找不到可比的先例。

QuestMobile的數據進一步揭示了用戶端的爆發：截至2026年第一季度末，AI原生應用的月活用戶數已達4.4億，僅Q1就新增1.3億用戶。其中，字節跳動的豆包以3.45億月活領跑市場，阿里千問月活1.66億，DeepSeek月活1.27億。更值得關注的是用戶行為深度的變化：月人均使用次數同比增長55.3%，人均使用時長增長41.4%，用戶結構也在悄然下沉——70后和60后用戶占比增加2.8%，三線及以下城市用戶占比增加2.4%（QuestMobile，2026年3月）。

然而，在中國市場光鮮的用戶數據背后，隱藏著一個難以回避的成本困境。由于美國對華芯片出口管制，中國企業被迫使用性能受限的H20芯片或尋找替代方案，這些替代方案的計算成本普遍高于國際同行的主流選擇。

換言之，當中國用戶在以驚人的速度消耗AI服務時，其背后的單位算力成本卻高于海外競爭對手。這種「高消耗、高成本」的組合，對于任何試圖在這個市場建立可持續商業模式的玩家而言，都是一個嚴峻的考驗。

新煉金術士

The New Alchemists

當資本的耐心逐漸消磨殆盡，2026年正在成為檢驗AI應用商業模式的真正元年。

風險投資的標準正在經歷一次深刻的轉變：紅杉中國于近期調整了其投資評估框架，將量化指標權重提升至60%，涵蓋投資回報率、成本節約額、付費轉化率、客戶留存率等硬指標，而定性指標僅占40%。a16z則更為直接地宣布，不再關注模型的參數規模，轉而評估「算力投入產出比」——即每1美元的算力投入能否創造3美元以上的營收。

這種投資邏輯的轉變，直接反映在成功與失敗的案例對比中。美的集團的AI應用已實現節約成本7億元人民幣，生產效率提升80%，排產響應速度提升90%，成為制造業AI轉型的標桿案例。它石智航在具身智能領域獲得4550萬美元Pre-A輪融資，并成功在歐洲倉儲場景落地。

相比之下，Builder.ai因虛報營收300%于2025年破產，負債1.15億美元；C3.ai在2025年虧損2.89億美元，仍未找到盈利路徑；十余家AI應用初創公司因成本結構無法閉環，在2026年第一季度停止運營。

這些案例揭示了一個殘酷的事實：在當前的AI產業格局中，能夠真正跑通商業模式的，往往是那些對成本結構有深刻理解、并能將其轉化為競爭優勢的企業。

Gartner預測，到2026年底，企業應用中集成AI Agent的比例將從不足5%躍升至40%，全球運營的AI智能體數量將超過10億個。OpenClaw開源智能體框架在發布后兩個月內GitHub星標數突破30萬，登頂全球榜首，引發騰訊、阿里、字節、百度、智譜AI等國內廠商密集入局。這一切都在預示著，AI Agent正在成為下一個兵家必爭之地。

然而，Agent的商業化路徑遠比聊天機器人復雜。當AI從「會聊天」進化到「能干活」時，其消耗的Token數量呈指數級增長。

一條TikTok視頻的分析可能需要數百個Token，多步驟的Agent工作流則可能輕松消耗數萬個Token。對于企業而言，這意味著AI的價值創造與成本消耗之間的博弈將更加激烈。

歷史的回響

Echoes of History

在所有關于AI未來的敘事中，有一個比喻被反復使用，卻很少被真正講透。那就是將AI比作19世紀末的電力。

歷史總是驚人地相似。1890年代的工廠主們發現，用電動機替換蒸汽機并沒有帶來預期的效率飛躍。他們只是在舊的生產線上簡單地裝上了電動機，卻仍然沿用著為蒸汽動力設計的工廠布局和組織方式。

直到幾十年后，當亨利·福特根據電力的特性重新設計整條流水線時，第二次工業革命的生產力紅利才真正爆發。

今天的AI正如當年的電力，而Token構成了這個時代的數字電力。然而，僅僅在現有的工作流中「接入」一個對話框，正如在舊機器上接上一根昂貴的電線，除了徒增算力成本之外別無他用。

那些真正捕獲AI時代紅利的企業，不是那些擁有最強大模型的公司，而是那些最深刻理解如何將AI能力轉化為全新價值形態的組織。他們重新思考業務流程，重新設計用戶體驗，重新定義成本結構，最終實現了從「用AI工作」到「為AI工作」的跨越。

這種跨越需要的不僅是技術能力，更是一種商業哲學的轉變。互聯網和SaaS時代的成功經驗告訴他們，規模就是一切，先占領市場再考慮盈利是顛撲不破的真理。

然而，當每個新增用戶都在消耗真實而昂貴的算力成本時，這條鐵律正在失效。取而代之的，是一種更為精細化、更為成本敏感的經營哲學——在追求增長的同時，必須時刻關注單位經濟學是否健康，因為在這個時代，規模的擴張可能恰恰是利潤的腐蝕劑。

未竟的變局

The Unfinished Revolution

2026年的AI產業正處于一個微妙的歷史節點。技術的能力邊界在快速拓展，用戶的接受程度在加速滲透，但商業模式的底層邏輯仍在迷霧中摸索。當算力成本成為決定生死的關鍵變量，當杰文斯悖論在每一張GPU賬單上重演，當推理的代價逐漸被資本市場定價，那個屬于「先燒錢后盈利」的草莽時代正在走向終結。

對于觀察者而言，這場變局最引人入勝之處在于其不確定性。沒有人知道推理成本會繼續以何種速度下降，沒有人確切預測Reasoning模型何時會找到可持續的定價方案，也沒有人能夠斷言哪個垂直場景最終會孕育出真正具有壁壘的商業模式。

但有一點是確定的：在這個算力即石油的新時代，那些能夠將「計算的代價」轉化為「計算的價值」的企業，將在未來的產業格局中占據不可替代的位置。

而對于更廣泛的商業世界而言，AI帶來的這場經濟學革命才剛剛開始。它的影響將遠遠超出科技行業本身，重塑從制造業到金融業、從教育到醫療的每一個角落。

當電力在19世紀末普及后，真正改變世界的不是電力公司本身，而是那些學會用電力重新設計一切的企業家。今天的AI或許正處于同樣的歷史關口。

Token經濟學的悖論從來不是一個需要被消除的系統Bug，它是市場進行殘酷篩選的機制。

作者：坦桑尼亞老云 | 編輯：栗加

每個視角都是拼湊世界真相的碎片，聽真誠的行業觀察者講述獨特的故事。我們有深耕行業的資深顧問，連續跨界探索的未來創業者，專注細節的產品匠人，和許多志同道合的你們，如果你有想要分享的故事或者感想，可以留言或者郵件聯系（AiysJY@outlook.com），也歡迎點分享給需要的朋友們，記得點一下在看和星標，期待共同在這個行業的宏大敘事中，留下一句詩。：）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.