(本文編譯自Electronic Design)
英偉達的爆發式發展及對其圖形處理器(GPU)的海量需求,推動全球AI處理器領域迎來發展熱潮。但專注于研發專用AI芯片的初創公司浪潮,已然觸頂,或已距頂峰咫尺之遙。
2016年以來,全球AI處理器初創企業的數量已翻倍不止,截至2025年底,該領域獨立運營的企業數量激增至146家,這一數字已處于難以為繼的水平。迄今,投資者受AI處理器市場的前景吸引,已向這些企業投入高達280億美元的巨額資金。據估算,2026年全球AI處理器市場規模將突破4940億美元,硬件出貨量的增長主要由云端及本地AI推理,以及從可穿戴設備到個人電腦的邊緣端部署所驅動,市場營收的增長則主要依托AI訓練場景及超大規模數據中心客戶的需求。
盡管英偉達的技術背后,有著深厚、完善且幾近難以撼動的軟件生態體系,以及一套完整的數據中心硬件基礎設施作為支撐,但這一切似乎并未被投資者放在眼里。只要宣稱能研發出速度更快、性能更優、成本更低的AI處理器,幾乎都會獲得投資者的青睞與資金支持。
不出所料,絕大多數初創企業的研發重心均聚焦于數據中心或邊緣端的AI推理領域。AI訓練領域的資金投入門檻依舊極高,多數初創企業已選擇退守,將這一市場拱手讓給英偉達。
分析機構Jon Peddie Research表示,未來一到兩年,獨立AI處理器供應商的數量將減少40%,實際情況甚至可能比這更糟。
然而,成功的窗口期正逐步向絕大多數的這些初創企業關閉。行業創業高峰出現在2018年,彼時75%的相關初創企業已成立。值得關注的是,初創企業數量的增長浪潮早于英偉達業務爆發式增長便已開啟,這一現象也曾讓科技行業為之震驚。
人們或許會認為,是英偉達的成功引來了一眾入局者的蜂擁而至,但事實上,多達58%的初創企業在英偉達崛起前就已啟動運營。2022年以來,該領域年均發生7起收購案;2020年至今,已有17家相關初創企業完成首次公開募股。
人工智能芯片初創企業的復雜格局
從基礎層面來看,人工智能處理器是一款經過特殊優化的芯片,它通過完成海量張量運算,同時最大限度減少數據移動,實現神經網絡工作負載的高速、高效運行。這類處理器的產品形態涵蓋GPU、神經網絡處理器(NPU)、存算一體芯片(CIM/PIM)、神經形態處理器,以及矩陣/張量引擎等。
CPU和FPGA雖也被用于運行人工智能工作負載,但由于二者具備通用計算屬性,無法依據功能進行細分,因此通常被排除在規模達850億美元的人工智能芯片市場之外,進行單獨評估。不過,搭載向量擴展或單指令多數據引擎的CPU(目前市面上的CPU基本均具備該特性),同樣歸屬于人工智能處理器的范疇。CPU、SoC與ASIC之間的范疇重疊,也讓整個市場格局顯得錯綜復雜(如圖1所示)。
![]()
圖1:用于人工智能訓練和推理的CPU、SoC及ASIC之間復雜的范疇重疊問題。
從基礎架構來看,人工智能處理器由多個核心組件構成(如圖2所示):
計算單元:大位寬單指令多數據/單指令多線程核心(GPU架構)、張量/矩陣引擎、NPU向量單元、激活函數單元。
存儲層級:靠近計算單元、容量小且速度快的SRAM;位于處理器外部或同封裝內、容量更大的HBM/DDR;高速緩存/便簽式存儲器;預取器/DMA(CIM大致歸屬于這一范疇)。
互連單元:片上網絡(NOC)與片外互連鏈路,包括但不限于PCIe、CXL、英偉達NVLink和以太網。
控制單元:用于核心程序/集合通信的指令處理器、調度器及微碼。
![]()
圖2:典型人工智能芯片的核心組件,包括計算、存儲與互連模塊。
人工智能處理器的應用版圖覆蓋云服務、數據中心芯片、嵌入式IP及神經形態硬件領域。創業者與工程師們著力彌補CPU和GPU的技術短板,包括優化內存管理、實現小批量任務的高利用率、在嚴苛的功耗預算下達成時延目標,以及保障規模化部署下的穩定吞吐性能。
這些企業主要從兩大維度布局產品研發:一是工作負載類型,涵蓋訓練、推理及傳感器級信號處理;二是部署層級,從超大規模數據中心,到電池供電設備與可穿戴設備均有覆蓋。
絕大多數技術研發工作聚焦于內存與執行控制領域。CIM和模擬計算技術通過在存儲陣列內完成運算、將部分和數據就近存儲的方式減少數據傳輸,這也催生出數據流架構設計思路。晶圓級芯片將激活值存儲在本地SRAM中,并為長序列任務實現權重的流式傳輸。
可重構架構可在編譯階段調整數據流與分塊策略,實現多層網絡的利用率優化。訓練芯片側重提升互連帶寬與集合通信能力,而推理芯片則將重點放在單批次任務時延優化、Transformer模型的鍵值緩存技術、邊緣端功耗效率上,同時追求云獨立部署能力以降低時延,這一點在智能體機器人應用中尤為關鍵。
人工智能處理器的市場落地,取決于企業的商業化策略與生態體系支撐。云服務提供商正將加速芯片集成至托管服務與模型推理框架中;IP供應商則與手機、汽車及工業領域的系統級芯片研發團隊展開合作,提供配套工具鏈、模型方案及集成密度演進路線圖。
此外,邊緣計算領域的專精企業會推出專用軟件開發工具包,對模型進行壓縮、量化至8位整數甚至更低精度,將算子映射至稀疏計算單元或模擬計算單元,同時保障模型精度達標。神經形態計算領域的研發團隊則針對脈沖神經網絡推出專屬編譯器,重點優化事件流處理的能效與時延表現。在實際應用中,編譯器、核心程序集和可觀測性工具的優化升級,其價值往往超過峰值每秒萬億次運算指標。
市場競爭的核心維度隨部署層級不同而有所差異(見圖3)。訓練芯片的競爭聚焦于單模型訓練成本,需綜合考量網絡、存儲及編譯器的各項約束條件;推理芯片則以單位token/單幀處理成本為核心目標,同時滿足時延限制,緩存管理與精度量化是實現這一目標的關鍵手段;邊緣設備的競爭圍繞單次推理功耗(毫瓦級)及工具鏈的可移植性展開;IP供應商的競爭則集中在流片周期、功耗-性能-面積綜合指標及驗證技術支持能力上。科研項目則需要在市場化落地速度與技術實驗探索之間尋求平衡,這類實驗或會改變存儲、計算與通信三者間的原有取舍邏輯。
![]()
圖3:人工智能芯片企業的市場細分分布。
在整個研發與落地過程中,各研發團隊會根據具體需求定制芯片設計,適配的需求維度包括注意力機制深度、參數量、激活值規模、稀疏性及精度策略等。當企業實現芯片、編譯器與部署工具的協同開發時,不僅能降低集成成本,還能加快從模型研發到高吞吐率落地的轉化效率。
此時客戶擁有多種選擇:在云端進行算力擴容、通過晶圓級系統實現算力升級、將NPU集成至SoC中,或是利用模擬芯片和神經形態芯片讓計算單元更貼近傳感器端。這筆280億美元的投資,正流向上述海量的研發與落地工作;而這些技術的布局與成果,也讓一眾初創企業成為極具吸引力的收購標的(見圖4)。
![]()
圖4:人工智能芯片初創企業按處理器類型的分布情況。
人工智能芯片初創企業的爆發式增長將落幕
但這場人工智能芯片初創企業的“寒武紀大爆發”,或許已行至終點。2025年末,市場首次出現投資者對超大規模企業、各國政府及私營機構的巨額算力設備投入感到擔憂的跡象,這也在由人工智能熱潮主導的股市中引發了連鎖反應(見圖5)。媒體上充斥著關于該市場存在泡沫的討論,以及對泡沫破裂時間的預判。
![]()
圖5:全球人工智能處理器供應商數量分布。
人工智能芯片供應商領域的泡沫破裂已在暗流涌動,畢竟沒有哪個行業能支撐146家供應商共存。
市場上已出現多起企業收購與倒閉案例(截至2025年底已有21起),后續還將有更多案例出現。但風險投資機構仍在賭概率,大概率是六家融資額超10億美元的企業將存活下來,其余百余家初創企業則需尋找37家處于收購窗口期的上市公司作為歸宿。Jon Peddie Research咨詢公司的預測顯示,未來一到兩年,獨立人工智能芯片供應商的數量將減少40%,而實際情況可能會更糟。
盡管多數初創企業終將被收購或走向倒閉,但被收購的企業會帶來免費的IP,而這筆成本早已由熱情樂觀的風險投資機構買單。280億美元足以支撐大量的研發工作,尤其是這些初創企業的平均員工數還不足10人。反觀英偉達,目前員工規模約為3.6萬人,雙方的競爭本就并非一場公平的較量。
這些收購案的背后,難免有人為錯失的發展可能感到惋惜。但如果創業的初衷只是“造出更優秀的處理器,客戶便會紛至沓來”,那么這份惋惜其實并無必要。
英偉達的行業主導地位,不僅依托其人工智能GPU的性能優勢和完善的軟件生態,更在于其始終聚焦于打造全套數據中心硬件基礎設施,這一布局讓它始終保持著行業領先。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.