齊魯晚報·齊魯壹點 劉慶義
近日,ISCA 2026(國際計算機體系結構研討會)公布論文錄用結果,理想汽車馬赫100芯片論文《M100: An Orchestrated Dataflow Architecture Powering General AI Computing》入選工業分區(Industry Track)。
ISCA是計算機體系結構領域的頂級學術會議,與MICRO(國際微體系結構研討會)、HPCA(國際高性能計算機體系結構研討會)和ASPLOS(國際體系結構與操作系統聯合研討會)并列為計算體系結構的四大會議,聚焦計算機硬件系統設計的前沿研究,包括處理器架構、存儲系統、并行計算、AI加速器、數據中心架構等方向。自2020年起,ISCA設立獨立的工業分區,要求主要作者來自工業界,重點展示成熟、高效且在實際工業產品中應用的解決方案。理想汽車是自ISCA工業分區設立以來,全球首家入選的汽車企業,彰顯其強大的研究實力和深厚的技術積累。
創新數據流架構
引領AI計算新高度
隨著AI技術深入汽車產業,從自動駕駛到大語言模型,從智能座艙到人機交互,各類場景對高性能、高效率的AI推理能力提出了更高要求。傳統方案存在兩難:通用GPU功能強大但成本高、能效有限;專用芯片高效但架構固化,難以適應AI算法的快速迭代,更難以覆蓋多樣化的AI應用。
理想汽車自研的馬赫100芯片力求在兩者之間找到最優解——既追求極致高效,又保持足夠通用性。其核心在于“周密編排數據流架構”(Orchestrated Dataflow Architecture)。與傳統芯片(包括GPU)依賴多級緩存反復搬運數據不同,馬赫100芯片通過編譯器提前規劃數據的移動路徑,通過高速DMA(直接存儲器訪問)將數據在計算單元之間精準直達——就像原料沿傳送帶從一個工位直接流向下一個工位,不進倉庫、不繞彎路。編譯器規劃得越好,數據流動越順暢,同步開銷越低。
![]()
馬赫100芯片在性能上展現出顯著優勢。馬赫100芯片采用5nm工藝制程,單顆算力達到1280 TOPS。得益于數據流架構提供給算法軟件最大的優化空間,馬赫100芯片的有效算力相當于英偉達Thor U的3倍。在相同場景下,這意味著更高的幀率、更短的響應時間,使車輛在緊急情況下能夠更早感知風險并更快采取避險動作。
馬赫100芯片證明了一條不同于GPU的可行路線:通過數據流架構與編譯器的深度協同,在AI推理場景中實現更優的性能和效率,為通用AI計算架構的未來演進提供了具有潛力的新方向。
深耕前沿AI技術
推動行業開放共享
近三年,理想汽車深耕具身感知、基座模型、推理芯片和操作系統等前沿AI技術的基礎理論研究,發表超過50篇論文,并獲得ICCV(國際計算機視覺大會,計算機視覺領域的頂級會議)、CVPR(國際計算機視覺與模式識別會議,計算機視覺領域的頂級會議)、ECCV(歐洲計算機視覺國際會議,計算機視覺領域的頂級會議)、ICML(國際機器學習大會,機器學習與人工智能領域的頂級會議)、ICRA(機器人與自動化國際會議,機器人與仿生學領域的頂級會議)等頂級學術會議錄用。
在追求技術高度的同時,理想汽車也致力于推動行業整體發展。秉持“技術開放共享”的理念,公司主動開源部分代碼與數據庫,為構建更加開放繁榮的技術生態貢獻力量(AD開源代碼庫:https://github.com/LiAutoAD)。馬赫100芯片論文已被ISCA 2026 Industry Track正式接收,將隨會議公開發表,屆時芯片的架構設計與實驗數據將完整呈現,為行業同行提供參考,共同推動AI計算架構的發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.