![]()
當所有人都在卷算力的時候,理想汽車開始卷「數(shù)學定律」了。
作者|周永亮
編輯|鄭玄
2026 年,智能輔助駕駛領域最大的謊言可能正在被戳破——「算力越大,車就一定越聰明」。
過去幾年,車企們的軍備競賽邏輯一直很粗暴,誰的芯片算力高,誰的模型參數(shù)多,好像誰就站在食物鏈頂端。
![]()
但理想汽車最近放出的一篇論文,指向了一個完全不同的方向:不是比誰的算力大,而是比誰把算力用得狠,能把有限的大腦容量用得更聰明、更高效,這才是未來競爭的關鍵。
這篇與國創(chuàng)決策智能技術研究所聯(lián)合發(fā)表的論文,提出了一個叫「軟硬協(xié)同設計定律」的數(shù)學框架。名字聽起來很學術,但它要解決的問題極其現(xiàn)實:在車上那塊功耗有限、散熱有限、成本有限的芯片里,怎么把大模型的智能榨到極致?
這不僅僅是一個工程優(yōu)化技巧,也是理想為自研芯片「馬赫 100」打下的理論基礎。
01
解密「軟硬協(xié)同設計定律」
聊技術之前,我們得先看清當下的行業(yè)困境。
當下,輔助駕駛的技術路線正在從規(guī)則驅動,全面轉向以大語言模型為核心的 VLA(視覺-語言-行動)系統(tǒng)。簡單說,你的車需要在本地跑一個「小型 GPT」,讓它能看懂路況、理解場景、做出決策。
問題來了:云端大模型可以拿成千上萬張 GPU 堆,但車上的芯片受功耗、散熱和成本的約束,算力天花板是死的。
更麻煩的是,芯片團隊和算法團隊的節(jié)奏天然對不上。芯片那邊按摩爾定律走,追求算力線性增長;算法這邊按 Scaling Law 的信仰走,恨不得參數(shù)指數(shù)級膨脹。
這兩條線各跑各的,導致了一個尷尬的現(xiàn)狀:芯片的峰值性能 ≠ 實際系統(tǒng)效能。精心設計的模型跑在芯片上,經(jīng)常無法充分發(fā)揮理論算力。為了適配硬件做的妥協(xié),又反過來把模型變「笨」了。
這不是理想一家的痛。英偉達、蘋果、谷歌全都在啃這塊硬骨頭。但理想的特殊之處在于,它是在 Orin 和 Thor 芯片上真刀真槍部署 VLA 大模型的過程中,被這個問題反復「毒打」過的玩家。
也許只有足夠的痛,才能下定決心從根上解決。
![]()
理想和國創(chuàng)決策智能技術研究所給出的解法,分三步走。
他們先做了一件有點「笨」但很扎實的事:訓練了 170 個不同架構的模型,評估了近 2000 個候選配置。
這意味著什么?以前解決這個問題靠「試錯」。算法團隊要花幾周甚至幾個月訓練模型、上車測試,不行再推倒重來。這是一個巨大的「黑箱」。現(xiàn)在,給定模型超參數(shù),不用訓練就能預測最終精度。這就從「黑箱試錯」變成了「白盒預測」。
但光預測精度還不夠。車載大模型在運行時會產(chǎn)生大量臨時數(shù)據(jù),像同時打開幾十個瀏覽器標簽頁一樣瘋狂吞噬內(nèi)存。于是他們祭出了第二個武器,將經(jīng)典的 Roofline 性能模型進行了「車載化革新」。
傳統(tǒng) Roofline 模型只考慮計算和內(nèi)存帶寬的平衡,但大模型跑在車載 SoC 上,還有 KV 緩存、MoE 路由、注意力機制等一堆特殊負載在搶內(nèi)存資源。研究團隊首次系統(tǒng)性地把這些因素全部納入建模,并在英偉達 Jetson Orin 和 Thor 平臺上完成了實測驗證。這相當于不僅看到了發(fā)動機的極限,還算清楚了油管、進氣道對速度的制約。
![]()
在兩個模型的基礎上,理想開發(fā)了 PLAS(帕累托最優(yōu) LLM 架構搜索)框架。你可以把它理解為一個「自動選配師」。給它輸入芯片的硬件參數(shù)(算力、帶寬、緩存層次)和工程約束(延遲、功耗、內(nèi)存),它就能自動吐出最優(yōu)的模型架構方案。
如果說,以前換一款芯片,算法團隊要花幾個月重新設計和調(diào)優(yōu)模型。那現(xiàn)在,理論上一周就能搞定。
效果呢?也非常不錯。優(yōu)化后的模型在跟 Qwen2.5-0.5B 保持完全相同延遲的前提下,精度提升了 19.42%。同樣的芯片,同樣的速度,聰明了將近五分之一。
02
六個反直覺的發(fā)現(xiàn)
比這個數(shù)學定律更有沖擊力的,是他們總結出了六個大的發(fā)現(xiàn),都在挑戰(zhàn)現(xiàn)有的芯片和模型設計常識。
其中最有沖擊的一條是,決定車載 AI 實際表現(xiàn)的,往往不是芯片的峰值算力,而是它的內(nèi)存帶寬和緩存效率。
打個比方,算力像廚師的刀工,而內(nèi)存帶寬像傳菜的速度;廚師刀工再快,菜送不上來,整個廚房照樣癱瘓。這也意味著,很多發(fā)布會上被大書特書的「XXX TOPS」算力數(shù)字,可能真沒大家以為的那么關鍵。
與此同時,另一個重磅發(fā)現(xiàn)同樣值得芯片行業(yè)警醒:稀疏計算將成為車載 AI 的標配。理想發(fā)現(xiàn),在車載這種「一次只處理一個請求」的典型場景下,一種叫 MoE(混合專家)的稀疏架構以 100% 的概率碾壓了所有密集架構。
通俗地說,這就像一個擁有 16 位專科醫(yī)生的醫(yī)院,每次看診只需要 1-2 位專家上場就行,而不是 16 個人一起圍著你轉,這既省資源又更高效。這意味著未來的車載芯片必須「天生」就懂得稀疏計算和動態(tài)調(diào)度,而不是傻乎乎地把所有計算單元一起點亮。
![]()
除此之外,三個工程層面的「坑」,同樣值得關注:AI 推理分為「理解輸入」和「逐字輸出」兩個階段(Prefill 與 Decode),兩者對硬件資源的需求截然不同。未來芯片不能是一條固定流水線,而要能根據(jù)階段動態(tài)切換「工作模式」。
同時,傳統(tǒng) Transformer 模型里一個叫 FFN 的關鍵模塊,長期沿用 4 倍擴展比,但理想的實驗證明這個「祖?zhèn)鲄?shù)」在車上是低效的,芯片內(nèi)部的計算單元配比需要重新設計。
再有,理論上把計算精度從高降到低(INT8 量化)應該快 2 倍,實際卻只快了 1.3~1.6 倍。差距來自各種精度轉換的「隱形稅」,只有芯片從底層指令集就原生支持混合精度,才能把這筆「稅」省回來。想靠壓縮「白嫖」性能,沒那么容易。
前五條發(fā)現(xiàn),表面上各說各的,但把它們摞在一起看,指向的是同一個結論:沒有萬能芯片,只有最適合特定場景的芯片。這意味著,只有自己最懂自己的算法需要什么,才能造出最高效的芯片。
這也是理想自己做芯片的底層邏輯。
03
為馬赫 100 鋪路
說到這兒,這篇論文的戰(zhàn)略意圖就很清楚了。它是理想的戰(zhàn)略拼圖之一,自研芯片馬赫 100。
根據(jù)披露的信息,馬赫 100 是一顆 5 納米制程的車規(guī)級芯片,預計 2026 年量產(chǎn),首搭于全新一代理想 L9。其 Livis 版本搭載 2 顆馬赫 100 芯片,芯片有效算力達 2560TOPS,是英偉達 Thor U 的 3 倍。
但「3 倍」這個數(shù)字本身不是重點。更重要的是,馬赫 100 是一顆「算法原生芯片」。它的微架構、內(nèi)存子系統(tǒng)、計算單元配比,不是芯片團隊拍腦袋定的,而是由軟硬協(xié)同設計定律「算」出來的。
打個比方,傳統(tǒng)芯片像是先蓋好房子再讓住戶適應戶型;馬赫 100 是先問清楚住戶的所有需求,再定制每一面墻的位置。
落到輔助駕駛體驗上,這意味著同樣的功耗和散熱條件下,馬赫 100 能跑更大、更聰明的模型。你的車在復雜路口的猶豫會更少,對異形障礙物的識別會更快,智能輔助駕駛的體驗會從「能用」更進一步邁向「好用」。
如果只把這篇論文看作理想秀一下「肌肉」,那就看淺了。
往深一層想,這篇論文真正在做的事,是重新定義車載 AI 芯片的評價體系。過去,行業(yè)評判芯片好不好,看 TOPS 算力、看制程、看參數(shù)規(guī)格,這些規(guī)則都是芯片廠商定的。但這次理想本質(zhì)上在說,這些指標不夠用了,真正決定系統(tǒng)性能的是算法和硬件之間的匹配效率。
再拉遠一點看,過去十年,汽車行業(yè)的智能化經(jīng)歷了三個階段:先是買芯片、跑別人的算法;然后是買芯片、跑自己的算法;現(xiàn)在,頭部玩家開始走向第三步,自研算法+自研算力,軟硬一體。
這條路,蘋果在手機上走過,谷歌在云端走過,特斯拉在 FSD 芯片上走過。它們的共同經(jīng)驗指向同一個結論:軟硬一體,才能帶來極致的體驗。
理想這篇論文的意義,不在于它提出了多漂亮的數(shù)學公式,而在于它用一套可驗證的方法論證明了,算法和芯片必須長在一起,才能把智能的上限真正打開。這道門檻,才是下一輪淘汰賽真正的分水嶺。
論文標題:《Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs》(可點擊文章最后閱讀原文查看)
*頭圖來源:理想汽車
本文為極客公園原創(chuàng)文章,轉載請聯(lián)系極客君微信 geekparkGO
極客一問
你如何看待理想汽車的這篇論文?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.