“我們正處在一個AI模型爆炸的年代,模型的迭代速度已經從過去的以年、以月為單位,進化到今天開始以周為單位進行演進。”清微智能副總裁陳逸倫在ICCAD 2025高峰論壇的演講中指出,從GPT-5、Qwen到DeepSeek等大模型的快速迭代,背后是對計算能力永無止境的苛求。
多份權威研究顯示,自2010年以來,AI模型訓練所需要的計算量大概以每年4-5倍的速度在增長,這已遠超傳統摩爾定律的發展軌跡。
更值得關注的是推理算力需求的爆發性增長。
“一年以前,AI還是一個聊天工具,今天已經進化成可以自主完成非常復雜多任務的AI Agent(智能體)。”陳逸倫分享道,在國內市場,截至今年6月底,日均Token處理量已突破30萬億,過去18個月內增長了300倍。
![]()
清微智能副總裁陳逸倫
面對如此迅猛的增長,傳統GPU架構正面臨嚴峻挑戰。
據最新報道,谷歌正在向Meta公司銷售其自研的TPU芯片,而Meta計劃最早明年從谷歌云租賃TPU算力,2027年起將谷歌的TPU整合到其數據中心內。受此消息影響,GPU龍頭的英偉達市值一夜蒸發千億美金。
顯然,非GPU芯片的增長勢頭已十分明確,而基于非GPU路線的可重構計算架構,正憑借技術、政策與市場的多重支撐,成為未來中國AI算力技術的核心發展趨勢之一。
“若按照當前趨勢持續擴張,預計到2030年,前沿AI的算力集群成本將超過1000億美元。”陳逸倫表示,這不僅是資金挑戰,更是能源、效率、供應鏈的全面挑戰。探索更高效、更具性價比的新計算架構已不是可選項,而是關乎產業可持續發展的必答題。
可重構計算是全球產業共識
可重構計算架構技術兼具通用芯片靈活性與專用集成電路高效性的優點,能根據不同的算法和應用需求靈活配置硬件資源,帶來更高有效的算力和更低的功耗。《國際半導體技術路線圖》曾表示,可重構技術是最具前景的未來計算架構。
陳逸倫在演講中強調,“我們的架構核心是可重構數據流,它就像一個樂高積木一樣,能夠讓芯片的硬件能夠像AI算法一樣動態重構,從而實現專用的高性能,同時也能保證通用的靈活性。”
“在海外高端芯片受限后,基于可重構等新架構的國產AI加速芯片,迎來了‘換道超車’最佳歷史機遇期。”陳逸倫表示。
目前,清微智能TX81芯片面向智算中心等大規模AI應用場景,以獨特“C2C算力網格技術”為核心,構建出高帶寬、低延遲的數據流通路。相較于依賴外部交換機的傳統方案,清微在擴展性、靈活性和傳輸效率上實現了架構級的代際提升。
搭載TX81芯片的REX1032訓推一體服務器可支持萬億以上參數大模型部署,整體解決方案成本相比同行業產品降低50%,能效比提升3倍。
商業化層面,在國產算力芯片領域,清微智能已取得扎實進展。
陳逸倫告訴TechSugar,目前清微智能可重構芯片累計出貨已超過3000萬顆。而在云端AI芯片方面,清微智能AI算力卡銷量超2萬張。
據IDC最新數據統計,2025年上半年,清微智能在國產非GPU(含可重構新架構及AISC)加速卡銷量中位列第六,已成功躋身國產算力第一梯隊。
![]()
11月17日,新華社發布《北京何以成為“人工智能第一城”》一文,明確指出北京已構建自主可控的AI“芯片矩陣”,昆侖芯、寒武紀、摩爾線程、清微智能等四大國產明星企業的核心產品實現性能領先。
在產品規劃上,陳逸倫透露,明年計劃推出性能更高的TX82系列產品。
“目前,我們的大算力芯片已實現主流模型穩定運行,在國內行業落地情況良好,走了一條與 GPU 不同的技術路線。”陳逸倫表示。
讓CUDA用戶“無感”遷移
陳逸倫強調,可重構技術路徑并非清微智能獨辟蹊徑,而是全球產業共識。他指出,可重構計算在國際上被列為未來關鍵的共性技術,也是中國新一代人工智能發展規劃的重點支持方向。從國外的斯坦福孵化的Sambanova,到谷歌的TPU,全世界眾多頂尖科研機構和公司都在這個方向持續探索。
在生態建設方面,面對“90% AI開發者仍習慣CUDA”的現實,清微智能采取了"三層兼容"策略,與傳統CUDA生態形成差異化優勢。
具體來說,陳逸倫表示:
第一層兼容是英偉達CUDA的API兼容,像cuDNN(專為深度學習設計的庫)、cuBLAS(用于線性代數運算的庫)用戶都可以使用,同時,清微智能和英偉達CUDA生態的兼容也在持續完善;
第二層是“Triton兼容”,這也是OpenAI主推的開源編譯器,行業內主流大模型廠商都在向Triton做遷移,清微也在聯合智源研究院,積極參與國內Triton生態的建設工作;
第三層就是在芯片最底層,類似英偉達PTX那一層,用戶可以用RISC-V的指令集去做整個芯片的編程,目前RISC-V開源生態也比較繁榮,對于用戶來說更容易進行性能極致調優。
此外,像一些主流的神經網絡框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容適配,保證框架上編程用戶做到無感遷移。因此,通過擁抱開源Triton+RISC-V生態,同時也兼容CUDA,清微智能可以為不同類型客戶提供適配方式。
“我們希望能夠做到客戶是對底層架構是無感知的,所以我們在中間做了相應的封裝。"陳逸倫表示。
從長期來看,隨著國內 AI 應用基于國產芯片開發,可重構架構的差異化優勢在于,既能通過兼容現有生態快速切入市場,又能依托本土生態建設形成長期壁壘,最終在 AI 推理、算力供給中實現平衡,為用戶提供高性價比的算力解決方案。
陳逸倫強調,“我們認為只要持續投入資源,生態建設將逐步完善。”
可重構等芯片創新空間可持續5-10年
對于AI算力市場的競爭,陳逸倫信心十足。
“在我們看來,可重構計算+3D Chiplet+晶圓級集成至少還可以探索很多年,這相當于‘芯片界的電磁彈射’,每一步都在對軟件、硬件作重新定義,在這條路上有更廣闊的發展空間。”陳逸倫表示,這些領域的工程創新空間至少可持續 5-10 年,這相當于“芯片界的電磁彈射”。
在陳逸倫看來,國內的架構創新空間巨大,國產替代、自主創新已經是大勢所趨,且刻不容緩。而基于可重構等新架構國產AI加速卡芯片,已經迎來了換道超車的最佳機遇。而清微智能的可重構技術體系涵蓋動態可重構計算(如搭積木般構造電路)、數據流計算(數據在芯片內部流動,不依賴外部存儲交互)、3D DRAM Chiplet 等底層技術,未來還將探索晶圓級芯片等前沿方向。
清微智能所代表的可重構計算路徑,正為中國算力自主可控開辟出一條切實可行的創新之路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.