![]()
生成式人工智能創造的不是泡沫,而是一種趨勢。
云服務商的資本支出(Capex)已經達到了無法再用“顯著增長”來形容的程度。排名前八的云服務商的投資額將從2021年的1451億美元增長到2026年的6020億美元,增長超過四倍。這種增長速度簡直令人難以置信。
即便如此,市場中仍不乏對這一主流避險配置的質疑聲:“又是一場泡沫”“遲早會破裂” 之類的論調甚囂塵上。但此類說法毫無事實依據,并非單純的主觀臆斷,本質上更是對現實的刻意回避。究其根源,當下的投資規模擴張,并非由經濟周期、市場情緒或泡沫化趨勢驅動,而是源于物理定律的底層支撐 —— 海量的算力需求。
核心關鍵在于,生成式人工智能的計算負載絕非 “搜索功能的延伸”,而是屬于更高維度的 “學習與推理” 范疇。正如后文將詳細闡釋的,谷歌搜索的算力架構以 CPU 為核心,而 ChatGPT 的推理環節則以 GPU 為核心展開大規模矩陣運算,其所需的計算量更是前者的 1 萬至 10 萬倍。
換言之,云服務廠商的算力投入并非出于主動選擇,而是源于行業競爭的必然要求 —— 若不跟進布局,便會在賽道中陷入落后。對于當下的云平臺而言,無法支撐生成式人工智能的運行,就等同于喪失核心價值。也正因如此,這場算力投資的浪潮不僅不會止步,更具備了不可逆的行業必然性。
云投資正以驚人的速度增長
圖1呈現了全球頭部八大云服務商的資本投入趨勢,這八家企業分別為亞馬遜(AWS)、微軟(Azure)、谷歌云(Google Cloud)、Meta(原 Facebook)、甲骨文(OCI)、阿里云、騰訊云與字節跳動。
![]()
圖1:排名前 8 的云服務提供商的資本投資情況。來源:根據 TrendForce 數據制作
正如本文開篇所述,這八家企業的資本開支規模將從 2021 年的 1451 億美元攀升至 2026 年的 6020 億美元,增幅超四倍。這樣的資本投入已非單純的 “增長”,而是邁入了加速擴張的階段。
盡管 2022-2023 年期間其資本開支出現短暫回落,但這絕非可以放松警惕的信號。從 2024 年開啟的回升態勢能夠清晰看出,頭部云服務商的布局已再度 “加碼升級”,而這一投資拐點恰好出現在 OpenAI 推出 ChatGPT 之后。
換言之,這些企業布局生成式人工智能相關投資,并非只因它是被追捧的 “下一個金礦”,更在于其作為行業游戲規則改變者,徹底重構了云計算基礎設施的底層需求。
驅動云計算領域投資擴張的因素多元且復雜:數據中心建設、土地儲備、電力配套、冷卻技術、網絡架構、存儲能力、安全體系…… 但貫穿所有維度的核心邏輯,始終是爆發式增長的計算需求。算力需求的指數級攀升,直接推動了全產業鏈各環節成本的同步上漲,本質而言,云計算行業的這場投資增長,就是一場對海量算力資源的爭奪戰。
當下市場對算力的極致需求,早已無法用傳統網絡與搜索服務的擴容邏輯來解釋。生成式人工智能對云計算的要求,并非簡單的 “再添一個胃”,而是倒逼整個行業重構算力 “消化系統”,打造出足以承載海量需求的超大規模算力底座。
Google搜索和ChatGPT相似但不相同
在此,需要糾正一個極具誤導性的核心認知偏差:將谷歌搜索與生成式人工智能簡單等同為 “用戶提出問題、平臺給出答案” 的同類工具。
如圖2所示,二者的用戶操作表層邏輯看似高度相似,交互形式幾乎別無二致。但現實是,坐擁全球超 30 億用戶的谷歌搜索,正面臨用戶向 ChatGPT 等生成式人工智能產品遷移的趨勢,而后者的用戶規模也已突破 10 億量級,持續快速擴張。
![]()
圖2:谷歌搜索與 ChatGPT 5 用戶提問行為示例。
自去年開始使用 ChatGPT 付費版后,個人便極少再使用谷歌搜索,核心原因正是前者的使用體驗更為高效便捷。而這一體驗上的差異,正被全球越來越多的用戶感知,也直接推動了生成式人工智能用戶規模的持續攀升。
更為關鍵的是,即便用戶提出的是完全相同的問題,谷歌搜索與 ChatGPT 等生成式人工智能在云端完成的底層處理邏輯,卻有著本質區別。
這一核心差異可通過圖3清晰呈現:谷歌搜索依托以 CPU 為核心的索引式檢索架構,而 ChatGPT 的推理過程,則是以 GPU 為核心展開的大規模矩陣運算。從算力消耗來看,谷歌搜索單輪處理的浮點運算量(FLOPs)約為 10 億至 100 億次,ChatGPT 的推理運算量則達到 10 萬億至 1000 萬億次,二者的算力需求相差 1 萬至 10 萬倍。
![]()
圖3:谷歌搜索與 ChatGPT 5 算力及處理成本對比。
不僅如此,ChatGPT 單次處理所需的服務器耗時,是谷歌搜索的 10-100 倍;能源消耗與碳排放,均為谷歌搜索的 10-200 倍;綜合成本更是達到谷歌搜索的 50-2000 倍,算力與資源消耗的差距呈指數級拉大。
簡言之,生成式人工智能絕非所謂的 “高端版搜索”,其背后是完全不同的計算邏輯,且承載著遠為繁重的算力負載。正因如此,生成式人工智能的規模化落地,意味著云端處理的計算單元必須向超大規模升級 —— 這并非依靠價格談判、市場推廣就能解決的商業問題,而是從物理底層提出的硬性要求:既需要 AI 半導體(如 GPU)、高帶寬內存(HBM)等核心硬件支撐,也離不開電力、冷卻系統、網絡架構的配套升級,甚至對底層的布線、封裝技術都提出了全新要求。
市場中常有一種論調:“技術效率終將提升,算力需求自然會下降。” 不可否認,AI 領域的技術效率確在持續優化,但算力需求的下降速度,早已跟不上生成式人工智能的應用邊界拓展、使用頻次提升與性能迭代速度。即便單輪計算的算力消耗因效率提升而降低,若社會層面的生成式人工智能使用頻次增長十倍,整體算力需求仍會同步攀升。更何況,隨著輸入輸出的文本長度持續增加,圖像、視頻類推理場景的落地應用,算力需求還將迎來新一輪的爆發式增長。
換言之,云計算行業的持續高投入,并非源于市場的 “盲目熱情” 或 “投資過熱”,而是算力需求發生結構性變革的必然結果。對頭部云廠商而言,一旦停止算力布局,就意味著直接確認市場競爭的落后態勢。推動其持續加碼投資的,從來不是敢于冒險的勇氣,而是源于行業競爭的深層恐懼 —— 對錯失算力浪潮、陷入競爭被動的恐懼,才是這場算力投資競賽的核心驅動力。
人工智能與以往的泡沫經濟有著本質區別
由此引出核心問題:當前這場圍繞生成式AI的云計算投資熱潮,真的是一場泡沫嗎?
答案很明確:將當前現象簡單斥為“泡沫”是完全錯誤的,核心原因在于,過去的泡沫與當前熱潮的“需求性質”存在本質差異。可通過定量分析清晰佐證這一點。
圖4呈現了全球半導體出貨量及其同比增速趨勢,清晰勾勒出Windows 95泡沫、IT泡沫與內存泡沫的完整軌跡。從數據可見,過往的各類泡沫均呈現“快速增長后驟降”的特征——這背后的核心邏輯是,當時的需求嚴重依賴“暫時性增長”與“庫存調整”,缺乏持續的底層支撐。
![]()
圖4:全球半導體出貨量及較上年增長率。來源:作者根據 WSTS 數據制作
圖5A通過對比表形式,呈現了Windows 95泡沫、IT泡沫、內存泡沫及當前AI熱潮(暫統稱“熱潮”)從第N年到第N+3年的同比增速變化;圖5B則進一步量化了這一波動:Windows 95泡沫期間增速達41.7%,隨后驟降至-8.6%;IT泡沫增速36.8%,后續跌至-32.0%;內存泡沫增速13.4%,繼而滑落至-12.0%。這種“繁榮后迅速蕭條”的劇烈波動,正是過往泡沫的典型特征。
![]()
來源:作者根據WSTS數據制作
與之形成鮮明對比的是生成式AI相關需求的增速表現:2023年同比增速為-8.1%,2024年回升至19.7%,2025年預計達22.5%——這意味著2024年及2026年將持續保持正增長。正如眾多行業專家論證的那樣,直至2030年,生成式AI相關需求大概率不會出現負增長。
簡而言之,當下正在發生的并非“泡沫”,而是一場單一、龐大且具備強大慣性的“結構性趨勢”。
此次趨勢與過往泡沫的核心差異,在于需求來源的本質不同:過往需求多源于個人電腦普及、智能手機更新換代等“替換購買浪潮”,屬于階段性的消費端需求爆發;而當前的需求核心,是計算基礎設施的剛性升級需求。更關鍵的是,生成式AI并非“銷售產品即完成閉環”的傳統業態——它將滲透到社會經濟的方方面面,融入各類服務場景,整合至搜索與辦公系統,成為企業生產力提升的核心基石。
由于這一核心基石建立在極其龐大的計算量之上,云計算投資便不再是“經濟繁榮期的可選配置”,而是成為支撐社會高效運轉的“基礎結構”。從這個意義上講,那些將生成式AI相關投資斥為“泡沫”的觀點,本質上是對這一結構性變革的逃避。這種“基礎設施級的算力需求爆發”,是過往教科書式的泡沫案例中從未出現過的全新形態。
到2030年,投資將持續增長
基于這一邏輯,2030年之前,相關投資的持續增長將是大概率事件。那么,頭部八大云服務廠商的資本支出最終將增長至何種規模?圖6呈現了這八大廠商數據中心投資的預測情況,并劃分了悲觀、基準、樂觀三種情景。
![]()
圖6:八大云服務提供商的數據中心投資預測。來源:TrendForce 新聞稿及作者預測
值得注意的是,即便在最悲觀的情景下,投資規模仍將保持持續增長——核心原因在于,生成式AI相關的算力布局已成為行業“競爭入場券”,而非可選擇性的“奢侈品”。
這正是生成式AI時代云計算競爭的殘酷之處:對云服務廠商而言,停止投資并不會帶來“利潤率提升”,反而會直接導致“AI性能落后、客戶流失、平臺價值崩塌”。換句話說,放緩或停止算力相關投資,并非理性的商業決策,更像是對市場競爭的主動認輸。
事實上,相關投資的退出成本極高:GPU與高帶寬內存(HBM)等核心硬件價格昂貴,電力供應、散熱技術的升級需要長期投入,且整個產業鏈的供應鏈體系錯綜復雜。即便面臨諸多挑戰,投資仍在持續推進——因為市場已形成明確的競爭格局:“缺乏足夠算力支撐的企業,將直接被市場淘汰”,甚至來不及進入投資回報率(ROI)的考量階段。
歸根結底,當前頭部云廠商的持續投資,已不再是“購買未來的不確定性”,而是“守護當前市場地位”的剛性需求。只要這一“算力決定競爭力”的市場結構不發生根本改變,到2030年投資持續增長的趨勢,似乎也成為了必然結果。
數據中心邏輯電路市場正在快速擴張
云計算投資的增加將直接推動半導體市場的擴張。特別是數據中心邏輯芯片,未來市場必將迎來增長。
圖7顯示了數據中心邏輯芯片市場(2024 年至 2030 年)的預測。GPU 市場預計將從 1000 億美元增長一倍以上至 2300 億美元,而 AI ASIC 市場預計將增長九倍以上,從 90 億美元增長至 840 億美元。
![]()
圖7:數據中心邏輯預測(2024 → 2030 年)。來源:作者根據 Yole Group 的預測數據制作
值得注意的是,生成式人工智能的發展不會止步于英偉達的GPU。超大規模數據中心運營商不愿依賴單一供應商,因為這意味著他們將失去價格談判能力。他們傾向于采用專用于特定應用的人工智能ASIC芯片,以“提升性能而非降低性能,并降低成本”。其中許多芯片由博通公司設計。
換句話說,人工智能半導體市場不會是“GPU獨占的黃金時代”,而是會轉型為“GPU仍將占據主導地位,而AI ASIC(博通)將發展壯大,成為市場兩大支柱”的市場格局。即使GPU繼續扮演主導角色,AI ASIC也必將增長。這就是數據中心邏輯市場的現實。
盡管內存供應短缺,但其價格仍在持續飆升
圖 8顯示了生成式 AI 將最積極消耗內存的領域。DRAM市場預計將從 2024 年的 970 億美元翻一番,達到 1940 億美元,其中 HBM 市場將達到 980 億美元。
![]()
圖8:存儲器市場預測(2024 → 2030 年)來源:作者根據 Yole Group 的預測數據制作
這意味著到2030年,HBM將占據DRAM市場的一半份額。這不僅是市場擴張,更是內存行業主導地位的轉變。
此外,圖 9顯示,DRAM 和 NAND 的現貨價格預計將在 2023 年至 2026 年間上漲。以往“價格上漲,產量增加,價格趨于穩定”的常識已不再適用。提高 HBM 的產量并非易事,提高良率也面臨挑戰,封裝也是一個重要因素。設備和材料方面都存在諸多限制,供應難以滿足需求。
![]()
圖9:DRAM 和 NAND 現貨價格上漲。來源:作者根據 TrendForce 數據制作
此外,內存制造商正將重心轉向人工智能服務器內存,因為這類內存利潤更高。這將減少用于個人電腦和智能手機的通用內存供應,并推高價格。換句話說,人工智能的普及將導致內存市場長期短缺和價格高企。
簡而言之,內存短缺問題將持續存在,價格也將持續上漲。這并非“特殊且暫時的現象”,而可能成為人工智能時代的新常態。
臺積電的主要盈利產品從N5轉向N3
最能有效利用這股“人工智能浪潮”獲利的半導體制造商很可能是臺積電。圖 10顯示了臺積電按制程節點劃分的銷售額趨勢,直觀地展現了其主要盈利產品從 N7 到 N5,再到 N3 的轉變過程。
![]()
圖 10:臺積電按節點劃分的季度銷售額。來源:作者根據臺積電歷史運營數據制作
圖11顯示了各節點晶圓投入量的變化趨勢。從圖中可以看出,未來只有 N5、N3 和 N2 節點的投入量會增長,而其他節點的投入量則呈下降趨勢。這并非一句空洞的“前沿技術很重要”,而是事實:只有前沿技術的投入量在增長。換句話說,臺積電已經轉型為一家完全依靠前沿技術盈利的晶圓代工廠。
![]()
圖11:臺積電各節點季度晶圓投入量(2025年第四季度預測)。來源:Claus Aasholm,以及作者估算
生成式人工智能需要海量的計算,這需要大量的高性能人工智能半導體,而這又需要龐大的先進工藝產能。臺積電是唯一能夠滿足這一需求的公司。這種簡單的因果關系正是半導體行業發展的驅動力。
N3的主導地位從蘋果轉移到英偉達和博通
此前,蘋果一直是臺積電最大的客戶,推動著臺積電尖端工藝的發展。然而,這種情況正在發生改變。
圖12和圖13顯示了臺積電按公司劃分的 N3 晶圓投入預測。數據顯示,英偉達和博通的投入量將在 2025 年至 2026 年間增長,超過蘋果。
![]()
圖 12:臺積電對各公司 3nm 晶圓投入量的預測(每月 1000 片晶圓)。來源:TrendForce
![]()
圖 13:臺積電對各公司 3nm 晶圓投入量的預測。來源:TrendForce
這不僅僅關乎客戶排名。從尖端半導體的發展史來看,這標志著一個時代的轉變:從智能手機處理器引領潮流的時代,過渡到人工智能半導體主導尖端技術的時代。
蘋果利用尖端技術提升用戶體驗。英偉達和博通則利用尖端技術稱霸云計算領域。二者的區別顯而易見。人工智能半導體并非“賣出去就完事”,它們將作為“持續運行的基礎設施”而廣泛應用。換句話說,對尖端工藝的需求具有極強的粘性。
N3 將成為臺積電的主要盈利產品,這不僅反映了臺積電的實力,也反映了人工智能如何重塑了尖端產品的需求結構。
同樣的現象也可能出現在臺積電的N2芯片上,臺積電將于2025年第四季度開始量產N2芯片。蘋果或許會率先使用N2芯片,但不出六個月,英偉達和博通很可能就會占據主導地位。換句話說,蘋果將成為打造最先進生產線的先驅,隨后英偉達和博通將成為市場主導者,為臺積電的利潤做出巨大貢獻。
真正的瓶頸在于CoWoS
然而,人工智能半導體的發展存在許多瓶頸,其中最嚴重的是 2.5D 封裝(如 CoWoS)的產能。
圖 14顯示了 2.5D 封裝的產能趨勢。人工智能半導體無法通過先進工藝節點制造的“單芯片”實現,必須與 HBM 結合才能形成系統。CoWoS 對此至關重要,只要這種產能不足,人工智能半導體的供應就將持續短缺。
![]()
圖 14:2.5D 封裝容量趨勢。來源:TrendForce
換句話說,當前人工智能市場的制約因素最終將歸結為一點:“CoWoS 不足”。
這里有一個與直覺相悖的預測:一旦CoWoS的限制解除,投資會趨于平靜嗎?答案恰恰相反:投資將會增加。
這是因為人工智能半導體目前供應受限,即使云服務提供商想要購買也無力承擔。一旦供應限制解除,此前被抑制的投資將會爆發。云服務提供商將抓住機會大量采購他們一直等待的半導體,建設人工智能數據中心,進一步加劇競爭。投資非但不會“趨于平靜”,反而極有可能“進入下一階段”。
生成式人工智能創造的不是泡沫,而是一種趨勢。這正在半導體行業引發一場“結構性變革”。而且,這場變革是不可逆轉的。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯系后臺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.