當(dāng)一篇聲稱"推理輸入成本幾乎免費(fèi)"的文章在行業(yè)掀起巨浪時(shí),我們是否該輕信這份"成本拆解報(bào)告"?有人說大模型推理輸入成本僅需零點(diǎn)零零一美元每百萬tokens,輸出成本卻高達(dá)三千美元,還據(jù)此算出五到二十倍的毛利率。但現(xiàn)實(shí)是,頭部AI公司年收入百億卻仍在燒錢,每次交互成本高達(dá)三十六美分,所謂"高毛利"不過是簡(jiǎn)化成本模型后的幻象。
行業(yè)共識(shí)早已明確:大模型的推理算力成本依然很高,未來推理算力需求可能是訓(xùn)練的百倍甚至千倍。當(dāng)模型規(guī)模爆炸式增長(zhǎng)遇上硬件資源有限提升,那些被"輸入成本幾乎免費(fèi)"掩蓋的GPU硬件、能源消耗、冗余計(jì)算等隱性成本,就像冰山一角下的龐大身軀,遲早會(huì)浮出水面。
![]()
GPU成本謬誤:被低估的硬件開銷
"原文章將H100成本假設(shè)為兩美元每小時(shí),可現(xiàn)實(shí)中的GPU租賃市場(chǎng)真如此友好嗎?"看看主流云平臺(tái)的實(shí)際價(jià)格:按需租賃價(jià)已達(dá)三美元左右,長(zhǎng)期合約也要近兩美元每小時(shí),還得加上押金和承諾期。這還沒算上硬件折舊、電力冷卻等隱性成本,實(shí)際開銷比假設(shè)高出近四成。
這就像用二手車的價(jià)格去估算新車成本,永遠(yuǎn)得不出真實(shí)結(jié)果。企業(yè)自建算力集群時(shí),單張GPU的資本支出、電力消耗和資金成本加起來,每小時(shí)實(shí)際成本至少兩美元八毛。當(dāng)硬件開銷比假設(shè)高出近四成,所謂"輸入免費(fèi)"的結(jié)論從根本上就站不住腳。
![]()
財(cái)務(wù)數(shù)據(jù)矛盾:營(yíng)收增長(zhǎng)與虧損并存的真相
當(dāng)一家公司年收入百億卻仍在"燒錢",所謂的"超高毛利"是否只是數(shù)字游戲?頭部AI企業(yè)一邊刷新營(yíng)收紀(jì)錄,一邊擴(kuò)大虧損缺口:有的年化收入達(dá)百億美元,全年虧損卻高達(dá)八十億美元;有的估值六百七十億美元,每賺一美元就需投入七毛五購(gòu)買算力。
這些企業(yè)把"單位token毛利"說成"整體盈利",卻刻意忽略基礎(chǔ)設(shè)施投入、應(yīng)收賬款周期和算力成本剛性等風(fēng)險(xiǎn)。當(dāng)推理業(yè)務(wù)陷入"增長(zhǎng)越快,虧損越多"的死循環(huán),我們?cè)撉逍蚜耍河冒賰|虧損堆砌的百億營(yíng)收,從來不是商業(yè)奇跡,只是數(shù)字游戲。
![]()
成本結(jié)構(gòu)復(fù)雜性:不止于"輸入輸出"的冰山
"原文章將推理成本簡(jiǎn)化為'輸入免費(fèi)、輸出昂貴',可真實(shí)的成本結(jié)構(gòu)真如此簡(jiǎn)單?"中國(guó)工程院院士的研究顯示,推理成本中算力占比高達(dá)百分之九十五,人力和數(shù)據(jù)成本加起來才百分之五。這意味著只看輸入輸出費(fèi)用,就像只計(jì)算蛋糕的面粉成本,卻忘了奶油和烘焙開銷。
真實(shí)的推理成本受模型規(guī)模、量化精度、上下文長(zhǎng)度等多因素影響。長(zhǎng)文本處理需要維持更大的中間狀態(tài)存儲(chǔ),模型參數(shù)增長(zhǎng)帶來的成本上升也不是簡(jiǎn)單的線性關(guān)系。那些被忽略的激活值存儲(chǔ)、KV緩存等"隱性成本",才是真正推高開銷的關(guān)鍵。
![]()
云廠商利潤(rùn)率真相:規(guī)模效應(yīng)下的"數(shù)字魔術(shù)"
"當(dāng)云廠商宣稱AI服務(wù)'高利潤(rùn)'時(shí),我們是否該追問:這利潤(rùn)來自技術(shù)優(yōu)勢(shì),還是財(cái)務(wù)技巧?"頭部云廠商的AI實(shí)例利潤(rùn)率其實(shí)遠(yuǎn)低于整體業(yè)務(wù),有的整體利潤(rùn)率近百分之四十,AI專用實(shí)例卻只有百分之十六點(diǎn)八。他們所謂的"高利潤(rùn)",不過是通過萬卡級(jí)集群規(guī)模和延長(zhǎng)硬件折舊周期玩的數(shù)字魔術(shù)。
中小廠商根本無法復(fù)制這種規(guī)模優(yōu)勢(shì):頭部企業(yè)能拿到一美元兩毛的GPU低價(jià),小廠商采購(gòu)單卡成本就高達(dá)三美元;前者GPU利用率能到七成,后者常低于三成。所謂"推理盈利門檻低",只是頭部廠商的"幸存者偏差"。
![]()
理性看待AI成本的長(zhǎng)期主義
AI推理不是"印鈔機(jī)",而是需要長(zhǎng)期投入的"技術(shù)基建"。那些宣揚(yáng)"推理不燒錢"的論調(diào),不過是簡(jiǎn)化成本模型后的幻象。我們既要認(rèn)識(shí)到當(dāng)前硬件成本高企的現(xiàn)實(shí),也該看到技術(shù)迭代帶來的降本空間——從模型壓縮到硬件優(yōu)化,AI成本曲線正呈現(xiàn)"短期高企、長(zhǎng)期趨緩"的特征。
唯有正視成本真相,既接納硬件迭代的陣痛,又擁抱技術(shù)優(yōu)化的紅利,AI才能真正走向可持續(xù)發(fā)展。這不是燒錢游戲,而是必須跨越的技術(shù)鴻溝——當(dāng)推理成本真正降下來時(shí),我們將迎來AI普惠的全新時(shí)代。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.