![]()
一、端側AI:從手機到汽車的算力革命
當你用手機拍攝夜景時,NPU實時優化光影;智能汽車在無網絡區完成障礙物識別;工業傳感器本地篩選異常數據——這些日常場景的背后,都藏著端側AI的身影。
所謂端側AI,即部署于終端設備的人工智能技術,無需依賴云端,通過本地芯片即可完成AI推理甚至部分訓練,憑借低延遲(如自動駕駛決策需<10ms)、強隱私保護(數據無需上傳云端)、低網絡依賴的核心優勢,正成為“端-邊-云”協同算力網絡的核心基石。
![]()
如今的端側AI已邁入規模化爆發期。據行業數據顯示,2025年中國端側AI芯片市場規模將達438億元,2030年更是有望突破1050億元,年復合增長率達19.1%。從應用領域看,消費電子是當前核心戰場,占整體市場營收的80%——2025年AI手機滲透率將達38%,出貨量預計4.7億部;而智能汽車則是增速最快的賽道,端側AI芯片在該領域的年復合增長率高達45%,且需滿足寬溫環境與ASIL-B安全認證等嚴苛要求。
但繁榮背后,三大核心瓶頸日益凸顯:
· 算力與功耗的矛盾:旗艦終端對NPU算力的需求已向500TOPS邁進,但先進制程的成本壓力陡增——3nm工藝芯片每降低10%功耗,成本便上漲30%,終端設備的續航需求更是讓“高算力低功耗”成為兩難命題;
· 場景碎片化難題:智能座艙需同時處理語音、視覺、觸控等多模態數據,工業質檢需高精度圖像識別,智能家居則追求輕量算力,單一架構的芯片難以適配全場景需求;
· 國產化卡脖子風險:EDA設計工具、先進封裝基板等關鍵環節仍依賴進口,高端端側AI芯片的良率控制也面臨挑戰,自主可控之路任重道遠。
![]()
二、Chiplet:破解端側AI困局的“算力樂高”
端側AI 的終極趨勢必然是實現 “人類全覆蓋”—— 從老人手腕上的健康監測手表,到電競玩家的低延遲耳機,從工程師的工業檢測終端,到兒童的教育學習設備,未來每一類人群、每一個細分場景,都將需要專屬的端側 AI 能力。這種 “全覆蓋” 必然催生海量個性定制需求:老人設備需強化心率、跌倒預警算法,電競設備需優先保障毫秒級響應,工業終端需適配復雜環境下的抗干擾算力…… 傳統芯片的標準化模式,根本無法滿足這種 “一人一策”、“一場景一方案” 的需求。
面對端側AI的發展瓶頸,Chiplet(芯粒)技術給出了破局答案。這種將大芯片拆分為可復用、可組合的小芯粒,再通過先進封裝技術集成的“算力樂高”模式,正從根本上重塑端側芯片的設計邏輯,精準擊中行業痛點。
1. 算力突破:成熟制程下的性能躍遷
端側設備對功耗的敏感度遠超云端——比如TWS耳機的AI降噪芯片,功耗需控制在5mW以內;智能手表的健康監測芯片,更是要在微瓦級功耗下實現算力輸出。而先進制程雖能提升性能,卻帶來了難以承受的成本壓力。Chiplet的異構集成方案,恰好平衡了“算力、功耗、成本”三者關系:將高算力需求的NPU芯粒采用先進制程制造,通用CPU、存儲等芯粒則使用成熟制程,通過2.5D/3D封裝技術實現芯粒間的高效互聯,既保證性能,又降低整體成本。
2. 場景適配:模塊化應對碎片化需求
“千人千面” 的應用場景,是端側AI芯片設計的核心挑戰,而 “人類全覆蓋” 的趨勢更讓這種挑戰升級為 “億萬場景、億萬需求”。傳統SoC芯片 “一刀切” 的架構,要么因算力過剩導致成本浪費,要么因性能不足無法滿足需求,“定制化” 的門檻極高。而 Chiplet 的模塊化特性恰好可以讓芯片具備“按需組合”的能力:
通過將大芯片分解為可復用的標準化芯粒,既能提升制造良率(小芯片的良率遠高于大芯片),又能實現功能模塊的靈活組合。Chiplet模式將徹底改變傳統Fabless模式的"單向供給"邏輯,使得用戶可根據不同場景的算力、接口、功耗需求,靈活搭配芯粒組合,大幅提升場景適配效率。
![]()
例如,可以將芯片的“通用功能”與“AI算力”解綁,設計標準化的基礎芯粒(如CPU、存儲、接口芯粒)和定制化的AI芯粒(如輕量NPU、高精度NPU、多模態處理芯粒),再通過應互聯技術實現芯粒間的快速適配。之后,針對智能家居場景,可組合“基礎芯粒+單輕量NPU芯粒”,滿足語音控制、環境感知等需求;針對智能座艙場景,則搭配“基礎芯粒+雙高精度NPU芯粒”,支撐多屏交互、駕駛員監測等復雜功能;而L4級自動駕駛場景,只需進一步擴展NPU芯粒數量,即可實現超大算力輸出。這種模式不僅將芯片研發周期從傳統的18個月縮短至6個月,還能讓企業根據訂單需求靈活調整配置,研發成本降低70%,極大提升了端側AI芯片的場景響應速度。
3. 自主可控:加速國產供應鏈協同突破
端側AI 芯片的國產化進程,一直受限于封裝、基板等關鍵環節的 “卡脖子” 問題。而 Chiplet 技術通過標準化互聯接口,推動國產供應鏈各環節的協同創新,為自主可控提供了新路徑。
在封裝環節,長電科技、通富微電等國產封裝企業,優化Chiplet 的互聯協議與封裝工藝,成功實現了全國產化的 2.5D 封裝方案,封裝良率提升至 98% 以上;在基板領域,北極雄芯與深南電路合作開發的高密度互聯基板,性能達到國際同類產品水平,成本卻降低 25%。更重要的是,隨著 UCIe(通用芯粒互聯協議)等標準的成熟,不同國產廠商的芯粒可實現 “自由組合”—— 企業可采用華為的 NPU 芯粒、龍芯的 CPU 芯粒、長電科技的封裝服務,再搭配華大九天的 EDA 工具,快速搭建自主可控的端側 AI 芯片方案。這種 “分工協作、優勢互補” 的模式,正加速端側 AI 芯片的國產替代進程,為中國芯片產業開辟新賽道。
三、未來已來:端側AI與Chiplet的協同圖景
隨著大模型向邊緣端滲透(如Meta的7B參數模型經量化后可在手機端運行),端側AI對算力的需求將持續激增,而Chiplet技術的演進方向也愈發清晰,二者的深度協同將開啟終端智能的新未來。
“一顆芯片打天下”是過去標準化芯片的邏輯 —— 一款 SoC 芯片覆蓋手機、平板、電視等多類設備,靠規模效應降低成本;而 “億萬顆芯片打天下”則是 Chiplet 支撐下的新邏輯:通過標準化芯粒的“自由組合”,為每一個細分場景、每一類人群打造專屬芯片,用“海量定制”替代“批量復制”。這種轉變的核心驅動力,正是端側 AI “人類全覆蓋” 的趨勢,而 Chiplet 則是實現這一轉變的核心技術路徑。
從技術層面看,3D堆疊集成將成為重要方向——通過Chiplet與PIM(存內計算)技術的結合,將存儲芯粒與計算芯粒垂直堆疊,可大幅提升數據傳輸帶寬(如語音推理場景需30GB/s帶寬),解決端側大模型運行的“內存瓶頸”;智能調度算法也將進一步升級,通過實時監測場景需求,自動分配各芯粒的算力資源,將算力利用率提升至70%以上,避免資源浪費。
從應用層面看,Chiplet的 “跨場景復用” 特性將打破行業壁壘——車規級NPU芯粒經輕微改造后,可用于工業設備的質檢場景;智能家居的輕量算力芯粒,也能適配可穿戴設備,大幅降低邊際成本。據行業預測,未來3-5年,智能汽車將超越消費電子,成為端側AI芯片的最大應用領域,而Chiplet技術將支撐這一轉型,幫助企業快速響應市場需求。
![]()
正如無錫高新區科產集團在調研中所言:Chiplet技術,不僅是端側AI算力突破的關鍵,更是中國芯片企業實現‘換道超車’的核心競爭力。在這場終端智能的革命中,端側AI與Chiplet的協同,將不僅改變芯片的設計與制造方式,更將推動AI技術深入生活的每一個角落,讓“智能無處不在”的未來加速到來。
< 奇普樂 · 往期文章 >
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.