網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI推理不燒錢？揭開成本謊言背后的四大真相

2025-08-29 23:17:00　來源: 前沿科技學(xué)習(xí)分享圈

北京舉報(bào)

分享至

當(dāng)一篇聲稱"推理輸入成本幾乎免費(fèi)"的文章在行業(yè)掀起巨浪時(shí)，我們是否該輕信這份"成本拆解報(bào)告"？有人說大模型推理輸入成本僅需零點(diǎn)零零一美元每百萬tokens，輸出成本卻高達(dá)三千美元，還據(jù)此算出五到二十倍的毛利率。但現(xiàn)實(shí)是，頭部AI公司年收入百億卻仍在燒錢，每次交互成本高達(dá)三十六美分，所謂"高毛利"不過是簡(jiǎn)化成本模型后的幻象。

行業(yè)共識(shí)早已明確：大模型的推理算力成本依然很高，未來推理算力需求可能是訓(xùn)練的百倍甚至千倍。當(dāng)模型規(guī)模爆炸式增長(zhǎng)遇上硬件資源有限提升，那些被"輸入成本幾乎免費(fèi)"掩蓋的GPU硬件、能源消耗、冗余計(jì)算等隱性成本，就像冰山一角下的龐大身軀，遲早會(huì)浮出水面。

GPU成本謬誤：被低估的硬件開銷

"原文章將H100成本假設(shè)為兩美元每小時(shí)，可現(xiàn)實(shí)中的GPU租賃市場(chǎng)真如此友好嗎？"看看主流云平臺(tái)的實(shí)際價(jià)格：按需租賃價(jià)已達(dá)三美元左右，長(zhǎng)期合約也要近兩美元每小時(shí)，還得加上押金和承諾期。這還沒算上硬件折舊、電力冷卻等隱性成本，實(shí)際開銷比假設(shè)高出近四成。

這就像用二手車的價(jià)格去估算新車成本，永遠(yuǎn)得不出真實(shí)結(jié)果。企業(yè)自建算力集群時(shí)，單張GPU的資本支出、電力消耗和資金成本加起來，每小時(shí)實(shí)際成本至少兩美元八毛。當(dāng)硬件開銷比假設(shè)高出近四成，所謂"輸入免費(fèi)"的結(jié)論從根本上就站不住腳。

財(cái)務(wù)數(shù)據(jù)矛盾：營(yíng)收增長(zhǎng)與虧損并存的真相

當(dāng)一家公司年收入百億卻仍在"燒錢"，所謂的"超高毛利"是否只是數(shù)字游戲？頭部AI企業(yè)一邊刷新營(yíng)收紀(jì)錄，一邊擴(kuò)大虧損缺口：有的年化收入達(dá)百億美元，全年虧損卻高達(dá)八十億美元；有的估值六百七十億美元，每賺一美元就需投入七毛五購(gòu)買算力。

這些企業(yè)把"單位token毛利"說成"整體盈利"，卻刻意忽略基礎(chǔ)設(shè)施投入、應(yīng)收賬款周期和算力成本剛性等風(fēng)險(xiǎn)。當(dāng)推理業(yè)務(wù)陷入"增長(zhǎng)越快，虧損越多"的死循環(huán)，我們?cè)撉逍蚜耍河冒賰|虧損堆砌的百億營(yíng)收，從來不是商業(yè)奇跡，只是數(shù)字游戲。

成本結(jié)構(gòu)復(fù)雜性：不止于"輸入輸出"的冰山

"原文章將推理成本簡(jiǎn)化為'輸入免費(fèi)、輸出昂貴'，可真實(shí)的成本結(jié)構(gòu)真如此簡(jiǎn)單？"中國(guó)工程院院士的研究顯示，推理成本中算力占比高達(dá)百分之九十五，人力和數(shù)據(jù)成本加起來才百分之五。這意味著只看輸入輸出費(fèi)用，就像只計(jì)算蛋糕的面粉成本，卻忘了奶油和烘焙開銷。

真實(shí)的推理成本受模型規(guī)模、量化精度、上下文長(zhǎng)度等多因素影響。長(zhǎng)文本處理需要維持更大的中間狀態(tài)存儲(chǔ)，模型參數(shù)增長(zhǎng)帶來的成本上升也不是簡(jiǎn)單的線性關(guān)系。那些被忽略的激活值存儲(chǔ)、KV緩存等"隱性成本"，才是真正推高開銷的關(guān)鍵。

云廠商利潤(rùn)率真相：規(guī)模效應(yīng)下的"數(shù)字魔術(shù)"

"當(dāng)云廠商宣稱AI服務(wù)'高利潤(rùn)'時(shí)，我們是否該追問：這利潤(rùn)來自技術(shù)優(yōu)勢(shì)，還是財(cái)務(wù)技巧？"頭部云廠商的AI實(shí)例利潤(rùn)率其實(shí)遠(yuǎn)低于整體業(yè)務(wù)，有的整體利潤(rùn)率近百分之四十，AI專用實(shí)例卻只有百分之十六點(diǎn)八。他們所謂的"高利潤(rùn)"，不過是通過萬卡級(jí)集群規(guī)模和延長(zhǎng)硬件折舊周期玩的數(shù)字魔術(shù)。

中小廠商根本無法復(fù)制這種規(guī)模優(yōu)勢(shì)：頭部企業(yè)能拿到一美元兩毛的GPU低價(jià)，小廠商采購(gòu)單卡成本就高達(dá)三美元；前者GPU利用率能到七成，后者常低于三成。所謂"推理盈利門檻低"，只是頭部廠商的"幸存者偏差"。

理性看待AI成本的長(zhǎng)期主義

AI推理不是"印鈔機(jī)"，而是需要長(zhǎng)期投入的"技術(shù)基建"。那些宣揚(yáng)"推理不燒錢"的論調(diào)，不過是簡(jiǎn)化成本模型后的幻象。我們既要認(rèn)識(shí)到當(dāng)前硬件成本高企的現(xiàn)實(shí)，也該看到技術(shù)迭代帶來的降本空間——從模型壓縮到硬件優(yōu)化，AI成本曲線正呈現(xiàn)"短期高企、長(zhǎng)期趨緩"的特征。

唯有正視成本真相，既接納硬件迭代的陣痛，又擁抱技術(shù)優(yōu)化的紅利，AI才能真正走向可持續(xù)發(fā)展。這不是燒錢游戲，而是必須跨越的技術(shù)鴻溝——當(dāng)推理成本真正降下來時(shí)，我們將迎來AI普惠的全新時(shí)代。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.