近日,國內AI實時推理芯片企業元川微宣布完成數億元天使輪系列融資,估值持續攀升。本輪系列融資由東方嘉富、元禾原點、峰瑞資本、源來資本、中芯聚源、深創投等知名機構聯合投資與追投,并得到浙江省科創投和杭州潤苗基金的關注和支持,更獲得產業投資方星宸科技(股票代碼:301536)和智微智能(股票代碼:001339)的持續加注。
資金將主要用于第一代LPU+架構AI推理芯片的研發與量產,為即將全面爆發的Agent(智能體)時代打造底層算力基礎設施。
LPU+:為實時推理而生的原生架構
LPU(Language Processing Unit)是專為AI推理設計的非馮·諾依曼架構芯片。當前大模型推理的核心瓶頸不是算力,而是數據搬移——傳統GPU/NPU依賴多級緩存(L1→L2→L3→HBM)逐級搬運數據,LPU用"硬件數據流架構"徹底替代,將數據搬移效率做到ASIC級別。
這一技術路線已獲行業驗證。全球首家LPU芯片公司Groq,2025年收入約5億美元,注冊開發者超200萬;同年12月,英偉達以200億美元獲得Groq技術授權并引入核心團隊,2026年3月GTC大會正式推出Groq 3 LPX產品。
Groq的LPU最初設計于2016年,主要面向CNN時代的推理需求。元川微的"LPU+"在保持LPU三大核心基因的基礎上,針對大語言模型、多模態、MoE(混合專家模型)等新一代AI架構進行了大量底層創新——"+"代表的正是面向Agent時代的全新能力。
具體而言,元川微LPU+架構的三大基因分別是:
?大帶寬:采用扁平化片上大SRAM直連計算單元,消除多級緩存層級帶來的訪問延遲。LPU的算力密度是GPU/NPU的2~3倍,相同算力只需1/2~1/3的芯片面積,省下的面積用于部署SRAM,相當于"免費"獲得了大容量高速存儲。
?確定性數據流:所有數據搬移完全ASIC化,數據在芯片內如流水線般自動流轉,每個時鐘周期的數據路徑在編譯時即已確定。
?靜態調度:所有資源分配和調度在編譯階段完成("調度前置"),運行時零動態開銷——沒有緩存未命中,沒有調度延遲,沒有仲裁等待。
元川微CEO楊總指出:"很多公司可能聲稱在做LPU,但往往只取其中一個特征。必須三個基因同時具備,才是真正的LPU。"
提升十倍推理效能,迎接Agent算力新需求
![]()
【圖1:傳統計算架構VS LPU+硬流水架構】
這一架構設計釋放了推理"確定性執行"的結構性優勢,以極簡硬件消除傳統處理器的隨機訪問延遲,實現推理速度5~10倍提升、能效比10倍優化。同時,方案顯著降低對先進制程與高端IP的依賴——在全球AI芯片供應鏈重構的背景下,這一特性具有重要的戰略意義。
隨著AI Agent爆發,算力消費主體從人類用戶轉向無數全天候運行的"數字員工",算力定價邏輯隨之改變——市場不再只為峰值算力(Tflops)買單,而是看重完成任務的綜合成本:算力的能力、算力的時間、算力的服務質量(QoS)。誰把"時延+確定性+成本"做到最優,誰就擁有定價權。
據行業預測,Agent時代推理算力占比將從當前約75%提升至90%以上。在金融高頻交易、實時決策系統、交互式AI助手、具身智能、工業質檢流水線等時延敏感場景中,每一毫秒的推理延遲削減都意味著直接的商業價值提升。
頂尖架構團隊,兼具創新與工程落地能力
元川微CEO擁有逾20年華為全球研發體系一線實戰與管理經驗。他曾于2008年赴美從零組建華為處理器團隊,2012年回國主導華為無線基帶算法與芯片部門,帶領團隊在該領域做到全球領先。
團隊選擇LPU路線并非偶然。LPU的架構本質是"數據驅動的純硬件流水架構",與無線通信基帶處理在工程學上高度相通——數據流架構第一次大規模商用成功正是在無線通信基帶領域,AI推理將是其第二個成功落地的重大場景。團隊將20年積累的架構設計、互連、存儲、編譯器等領域的深厚經驗,完整遷移至AI推理芯片的設計中。
元川微核心團隊均來自頂尖芯片企業,人均15年以上經驗,累計交付數十款大規模量產芯片。CEO表示:"LPU架構是典型的軟件定義硬件——數據流是第一公民,數據流的管理完全由編譯工具完成。其設計理念、工具鏈、硬件數據流架構、高密度SRAM,每一環都有很高的壁壘。我們最大的護城河,是一支完整的、有過成功經驗的團隊。"
目前,元川微已完成自研LPU+架構的FPGA驗證,所有性能指標均達到設計預期。公司正全力推進第一代LPU+推理芯片的研發,編譯器將在芯片回片前通過仿真器提前驗證和優化,以達到商用標準。在商業化方面,公司已與產業投資方深度協同,形成明確的產品路標規劃,同時正積極拓展云廠商、算力中心等新客戶合作。從架構驗證到產品落地,元川微正在加速跑完最關鍵的一程,讓LPU+成為Agent時代的標準算力底座。
投資人觀點
【東方嘉富合伙人徐曉】:
AI產業正從大模型訓練的軍備競賽,邁入Agent規模化落地的全新階段,低時延、高確定性、高性價比的實時推理算力,已然成為支撐AI產業持續爆發的核心底座,更是國產算力實現自主突圍的關鍵賽道。元川微團隊憑借二十余年芯片領域的深厚積累與大規模量產落地能力,打造的全自研LPU +原生架構,直擊傳統GPU/NPU數據搬移效率的核心瓶頸,在推理性能、能效比與成本控制上實現了量級突破。未來東方嘉富將持續深度賦能,全面聯動產業生態資源,全力支持公司芯片的研發、量產與全場景商業化落地,助力元川微成長為國產AI實時推理芯片的領航者。
【元禾原點合伙人樂金鑫】:
我們十年前天使投資寒武紀開啟了對AI時代算力基礎設施的體系化投資布局,今天選擇投資元川微作為端側推理芯片落子,這是一個開啟AI萬億應用市場的巨大機遇。元川微團隊具備前瞻的市場洞察能力,成熟的產品化經驗和扎實的技術實力;憑借獨特的技術架構,其規劃的系列產品在成本、效率、時延上為諸多端側推理應用提供最優解決方案。我們將攜手產業資源持續加注,加速企業成長與商業化落地,期待元川微成為詞元時代的中堅力量!
【峰瑞資本合伙人楊永成】:
元川微創立并獲得大額天使投資之際,恰逢英偉達以200億美金收購推理端AI LPU處理器創業公司Groq,推動了AI推理處理器領域的技術熱潮。從投資視角看,隨著大模型迭代與應用落地,專為推理端優化的AI處理器已進入高速發展期,在市場預判與技術布局上,元川微與英偉達等國際巨頭殊途同歸,彰顯了團隊對趨勢的把握和前瞻性。元川微核心團隊深耕芯片領域多年,具備深厚技術積累與產業經驗。在AI推理應用即將迎來爆發式增長的關鍵節點,團隊精準切入高效率、高實時性、高性價比的AI推理芯片賽道,正是"正確的人在正確的時機選擇了正確的方向"。預祝元川微團隊在AI推理芯片領域持續突破,奮勇前行。
關于元川微
元川微(ArcheFlowX)是一家專注于超低時延AI推理芯片的科技公司,基于全自研LPU+架構,致力于為Agent時代構建實時推理算力基礎設施。公司成立于2025年9月,創始團隊來自全球頂尖芯片企業,研發布局于上海、杭州兩地。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.