網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

告別「暴力堆料」，理想汽車打破車載芯片「高算力低智能」困局

2026-03-05 16:53:47　來源: 極客公園

北京舉報

分享至

當所有人都在卷算力的時候，理想汽車開始卷「數(shù)學定律」了。

作者｜周永亮

編輯｜鄭玄

2026 年，智能輔助駕駛領域最大的謊言可能正在被戳破——「算力越大，車就一定越聰明」。

過去幾年，車企們的軍備競賽邏輯一直很粗暴，誰的芯片算力高，誰的模型參數(shù)多，好像誰就站在食物鏈頂端。

但理想汽車最近放出的一篇論文，指向了一個完全不同的方向：不是比誰的算力大，而是比誰把算力用得狠，能把有限的大腦容量用得更聰明、更高效，這才是未來競爭的關鍵。

這篇與國創(chuàng)決策智能技術研究所聯(lián)合發(fā)表的論文，提出了一個叫「軟硬協(xié)同設計定律」的數(shù)學框架。名字聽起來很學術，但它要解決的問題極其現(xiàn)實：在車上那塊功耗有限、散熱有限、成本有限的芯片里，怎么把大模型的智能榨到極致？

這不僅僅是一個工程優(yōu)化技巧，也是理想為自研芯片「馬赫 100」打下的理論基礎。

解密「軟硬協(xié)同設計定律」

聊技術之前，我們得先看清當下的行業(yè)困境。

當下，輔助駕駛的技術路線正在從規(guī)則驅動，全面轉向以大語言模型為核心的 VLA（視覺-語言-行動）系統(tǒng)。簡單說，你的車需要在本地跑一個「小型 GPT」，讓它能看懂路況、理解場景、做出決策。

問題來了：云端大模型可以拿成千上萬張 GPU 堆，但車上的芯片受功耗、散熱和成本的約束，算力天花板是死的。

更麻煩的是，芯片團隊和算法團隊的節(jié)奏天然對不上。芯片那邊按摩爾定律走，追求算力線性增長；算法這邊按 Scaling Law 的信仰走，恨不得參數(shù)指數(shù)級膨脹。

這兩條線各跑各的，導致了一個尷尬的現(xiàn)狀：芯片的峰值性能 ≠ 實際系統(tǒng)效能。精心設計的模型跑在芯片上，經(jīng)常無法充分發(fā)揮理論算力。為了適配硬件做的妥協(xié)，又反過來把模型變「笨」了。

這不是理想一家的痛。英偉達、蘋果、谷歌全都在啃這塊硬骨頭。但理想的特殊之處在于，它是在 Orin 和 Thor 芯片上真刀真槍部署 VLA 大模型的過程中，被這個問題反復「毒打」過的玩家。

也許只有足夠的痛，才能下定決心從根上解決。

理想和國創(chuàng)決策智能技術研究所給出的解法，分三步走。

他們先做了一件有點「笨」但很扎實的事：訓練了 170 個不同架構的模型，評估了近 2000 個候選配置。

這意味著什么？以前解決這個問題靠「試錯」。算法團隊要花幾周甚至幾個月訓練模型、上車測試，不行再推倒重來。這是一個巨大的「黑箱」。現(xiàn)在，給定模型超參數(shù)，不用訓練就能預測最終精度。這就從「黑箱試錯」變成了「白盒預測」。

但光預測精度還不夠。車載大模型在運行時會產(chǎn)生大量臨時數(shù)據(jù)，像同時打開幾十個瀏覽器標簽頁一樣瘋狂吞噬內(nèi)存。于是他們祭出了第二個武器，將經(jīng)典的 Roofline 性能模型進行了「車載化革新」。

傳統(tǒng) Roofline 模型只考慮計算和內(nèi)存帶寬的平衡，但大模型跑在車載 SoC 上，還有 KV 緩存、MoE 路由、注意力機制等一堆特殊負載在搶內(nèi)存資源。研究團隊首次系統(tǒng)性地把這些因素全部納入建模，并在英偉達 Jetson Orin 和 Thor 平臺上完成了實測驗證。這相當于不僅看到了發(fā)動機的極限，還算清楚了油管、進氣道對速度的制約。

在兩個模型的基礎上，理想開發(fā)了 PLAS（帕累托最優(yōu) LLM 架構搜索）框架。你可以把它理解為一個「自動選配師」。給它輸入芯片的硬件參數(shù)（算力、帶寬、緩存層次）和工程約束（延遲、功耗、內(nèi)存），它就能自動吐出最優(yōu)的模型架構方案。

如果說，以前換一款芯片，算法團隊要花幾個月重新設計和調(diào)優(yōu)模型。那現(xiàn)在，理論上一周就能搞定。

效果呢？也非常不錯。優(yōu)化后的模型在跟 Qwen2.5-0.5B 保持完全相同延遲的前提下，精度提升了 19.42%。同樣的芯片，同樣的速度，聰明了將近五分之一。

六個反直覺的發(fā)現(xiàn)

比這個數(shù)學定律更有沖擊力的，是他們總結出了六個大的發(fā)現(xiàn)，都在挑戰(zhàn)現(xiàn)有的芯片和模型設計常識。

其中最有沖擊的一條是，決定車載 AI 實際表現(xiàn)的，往往不是芯片的峰值算力，而是它的內(nèi)存帶寬和緩存效率。

打個比方，算力像廚師的刀工，而內(nèi)存帶寬像傳菜的速度；廚師刀工再快，菜送不上來，整個廚房照樣癱瘓。這也意味著，很多發(fā)布會上被大書特書的「XXX TOPS」算力數(shù)字，可能真沒大家以為的那么關鍵。

與此同時，另一個重磅發(fā)現(xiàn)同樣值得芯片行業(yè)警醒：稀疏計算將成為車載 AI 的標配。理想發(fā)現(xiàn)，在車載這種「一次只處理一個請求」的典型場景下，一種叫 MoE（混合專家）的稀疏架構以 100% 的概率碾壓了所有密集架構。

通俗地說，這就像一個擁有 16 位專科醫(yī)生的醫(yī)院，每次看診只需要 1-2 位專家上場就行，而不是 16 個人一起圍著你轉，這既省資源又更高效。這意味著未來的車載芯片必須「天生」就懂得稀疏計算和動態(tài)調(diào)度，而不是傻乎乎地把所有計算單元一起點亮。

除此之外，三個工程層面的「坑」，同樣值得關注：AI 推理分為「理解輸入」和「逐字輸出」兩個階段（Prefill 與 Decode），兩者對硬件資源的需求截然不同。未來芯片不能是一條固定流水線，而要能根據(jù)階段動態(tài)切換「工作模式」。

同時，傳統(tǒng) Transformer 模型里一個叫 FFN 的關鍵模塊，長期沿用 4 倍擴展比，但理想的實驗證明這個「祖?zhèn)鲄?shù)」在車上是低效的，芯片內(nèi)部的計算單元配比需要重新設計。

再有，理論上把計算精度從高降到低（INT8 量化）應該快 2 倍，實際卻只快了 1.3～1.6 倍。差距來自各種精度轉換的「隱形稅」，只有芯片從底層指令集就原生支持混合精度，才能把這筆「稅」省回來。想靠壓縮「白嫖」性能，沒那么容易。

前五條發(fā)現(xiàn)，表面上各說各的，但把它們摞在一起看，指向的是同一個結論：沒有萬能芯片，只有最適合特定場景的芯片。這意味著，只有自己最懂自己的算法需要什么，才能造出最高效的芯片。

這也是理想自己做芯片的底層邏輯。

為馬赫 100 鋪路

說到這兒，這篇論文的戰(zhàn)略意圖就很清楚了。它是理想的戰(zhàn)略拼圖之一，自研芯片馬赫 100。

根據(jù)披露的信息，馬赫 100 是一顆 5 納米制程的車規(guī)級芯片，預計 2026 年量產(chǎn)，首搭于全新一代理想 L9。其 Livis 版本搭載 2 顆馬赫 100 芯片，芯片有效算力達 2560TOPS，是英偉達 Thor U 的 3 倍。

但「3 倍」這個數(shù)字本身不是重點。更重要的是，馬赫 100 是一顆「算法原生芯片」。它的微架構、內(nèi)存子系統(tǒng)、計算單元配比，不是芯片團隊拍腦袋定的，而是由軟硬協(xié)同設計定律「算」出來的。

打個比方，傳統(tǒng)芯片像是先蓋好房子再讓住戶適應戶型；馬赫 100 是先問清楚住戶的所有需求，再定制每一面墻的位置。

落到輔助駕駛體驗上，這意味著同樣的功耗和散熱條件下，馬赫 100 能跑更大、更聰明的模型。你的車在復雜路口的猶豫會更少，對異形障礙物的識別會更快，智能輔助駕駛的體驗會從「能用」更進一步邁向「好用」。

如果只把這篇論文看作理想秀一下「肌肉」，那就看淺了。

往深一層想，這篇論文真正在做的事，是重新定義車載 AI 芯片的評價體系。過去，行業(yè)評判芯片好不好，看 TOPS 算力、看制程、看參數(shù)規(guī)格，這些規(guī)則都是芯片廠商定的。但這次理想本質(zhì)上在說，這些指標不夠用了，真正決定系統(tǒng)性能的是算法和硬件之間的匹配效率。

再拉遠一點看，過去十年，汽車行業(yè)的智能化經(jīng)歷了三個階段：先是買芯片、跑別人的算法；然后是買芯片、跑自己的算法；現(xiàn)在，頭部玩家開始走向第三步，自研算法＋自研算力，軟硬一體。

這條路，蘋果在手機上走過，谷歌在云端走過，特斯拉在 FSD 芯片上走過。它們的共同經(jīng)驗指向同一個結論：軟硬一體，才能帶來極致的體驗。

理想這篇論文的意義，不在于它提出了多漂亮的數(shù)學公式，而在于它用一套可驗證的方法論證明了，算法和芯片必須長在一起，才能把智能的上限真正打開。這道門檻，才是下一輪淘汰賽真正的分水嶺。

論文標題：《Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs》（可點擊文章最后閱讀原文查看）

*頭圖來源：理想汽車

本文為極客公園原創(chuàng)文章，轉載請聯(lián)系極客君微信 geekparkGO

極客一問

你如何看待理想汽車的這篇論文？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.