“一段式”與“兩段式”，看不見上限的軍備競賽

2024-11-01 13:51:31　來源: 新浪汽車出品

北京舉報

分享至

10月29日，小米在發(fā)布會上表示10月30日在全國范圍內(nèi)部署城區(qū)NOA。而“端到端”將在11月底內(nèi)測，12月底推送先鋒版。其實，今年夏天開始，“端到端”智駕就成了業(yè)內(nèi)最火的概念。就在小米發(fā)聲前一周，理想汽車也剛剛宣布了自己的端到端進程。

小米還在瘋狂趕工中的“端到端”，是“一段式”（感知和規(guī)控合為一體），還是“兩段式”（感知和規(guī)控模塊分開，中間嵌入人工接口），目前沒有公開信息。不過，9月份小米將原來“感知”和“規(guī)控”兩個二級部門合并為“端到端算法與功能部”。組織架構(gòu)的變化，暗示小米至少將“一段式”作為目標(biāo)。

截至目前，已經(jīng)有十幾家主機廠和供應(yīng)商，聲稱上馬或者即將上馬“端到端”，以至于這個概念，從新鮮到濫俗，只花了不到1年時間。不管有沒有，都得說有。看如今的流量打法，嘴上輸了就等于“輸陣”。閩南人說“輸人不輸陣，輸陣歹看面”。對潛在受眾和自家團隊構(gòu)成士氣打擊，不是小事。

圖：一段式端到端示意圖

“一段式”和“兩段式”，雙方旗鼓相當(dāng)

目前，聲稱已部署“一段式”端到端的供應(yīng)商，只有Momenta。智己、廣豐、埃安，作為Momenta的客戶，宣布同期部署。就在10月28日舉辦的品牌智能駕駛技術(shù)日上，智己汽車宣布IM AD 3.0完成從“最像人”到“有直覺”的進化，邁入“直覺”智駕新時代。

而表示“即將”部署“一段式”的品牌，則包括理想、小米、商湯科技、元戎啟行等。“兩段式”主機廠和供應(yīng)商似乎數(shù)量更多，目前有小鵬、極氪、極越、魏牌藍山、鴻蒙智行等。

而寶駿作為大疆的用戶，不但部署了卓馭+寶駿云海（參數(shù)丨圖片），還特意標(biāo)明為“中算力兩段式端到端”。

至于華為的鴻蒙系，客戶包括問界、享界、智界、嵐圖、阿維塔、方程豹、廣汽傳祺。東風(fēng)猛士、尊界也宣布了與華為合作的信息，但迄今尚無“端到端”部署規(guī)劃。華為的態(tài)度，暫時未將“一段式”作為目標(biāo)。而且，華為也不認(rèn)為“兩段式”是通往“一段式”的過渡形式。

除此之外，奇瑞、長安啟源、地平線、輕舟智航等，雖然規(guī)劃了端到端，但未說明形式。

到現(xiàn)在為止，端到端領(lǐng)域，看似支持“兩段式”品牌略多于“一段式”。如果將同一供應(yīng)商技術(shù)來源的，都視為一個品牌，兩者幾乎旗鼓相當(dāng)。

在實現(xiàn)高等級自動駕駛諸多技術(shù)路徑當(dāng)中，端到端值得嘗試，很可能不是唯一路徑，甚至不是最優(yōu)路徑。

我們曾提到過，“兩段式”的優(yōu)勢在于，人工接口信息可觀測，但感知輸出的白盒狀態(tài)，就意味著信息過濾后存在損失。

而“一段式”和“兩段式”相比，理論上前者信息丟失少，上限應(yīng)該比較高。但鑒于“一段式”可解釋性更差，到底突破什么下限，大家都沒底。因此所有廠商，不管做的是“一段式”還是“兩段式”，無一例外都設(shè)置了兜底規(guī)則（rule-based）。這也意味著“兩段式”同樣存在不可解釋的部分。

數(shù)據(jù)需求決定部署規(guī)模

雖然“端到端”的參數(shù)量只相當(dāng)于中模型，在一枚英偉達Orin-X上就能跑起來，貌似消耗算力不多。但背后必須有大數(shù)據(jù)和大模型支持。數(shù)據(jù)的門檻不僅是對絕對數(shù)量的要求，對于數(shù)據(jù)的分布和多樣性要求也極高，而且還要求是100%的好數(shù)據(jù)（合規(guī)最優(yōu)操作）。

主機廠自研，和由供應(yīng)商推動，最大的區(qū)別不是技術(shù)本身，而是數(shù)據(jù)獲取能力。后者理論上能獲得多個品牌的產(chǎn)品數(shù)據(jù)，數(shù)據(jù)量更大。

有人表示，“一段式”端到端應(yīng)部署在20萬元以上中高端車上。現(xiàn)在沒有跡象表明，“一段式”就比”兩段式“需要更大的車端算力和更強的感知能力（比如有無激光雷達）。將端到端能力作為入門級和高配區(qū)分的一個維度，有可操作性，但同時其演化規(guī)律又要求更大的數(shù)據(jù)量，即盡量擴大部署規(guī)模。兩者要求背離。

何去何從，需要掂量一下。當(dāng)前端到端的競爭主軸并非現(xiàn)實商業(yè)利益，而是盡快迭代起來，形成明顯的使用價值。由此可見，即便實地部署了“一段式”端到端，迭代到可用、好用，群眾滿意的地步，也需要長期投入。

算力大比拼

不可否認(rèn)，“一段式”模型，設(shè)計源頭就比“兩段式”難度更大，調(diào)參回路更長、落地流程也更艱難一些。

圖：AlexNet多層神經(jīng)網(wǎng)絡(luò)

設(shè)計一個可工作的神經(jīng)網(wǎng)絡(luò)（模型）需要很多人類智力資源，訓(xùn)練它更復(fù)雜。神經(jīng)網(wǎng)絡(luò)的每一個子網(wǎng)絡(luò)，都涉及歸一化、偏差、非線性輸出，校正回歸等一堆問題。而且多層網(wǎng)絡(luò)讓這些問題的復(fù)雜度上升了維度。

訓(xùn)練促使模型從出生到成熟，訓(xùn)練的本質(zhì)是定量分析。如果用5000萬個clips（視頻片段）訓(xùn)練模型20輪，相當(dāng)于分析1B個clips。訓(xùn)練中心算力直接決定系統(tǒng)迭代速度。

圖：訓(xùn)練系統(tǒng)

而算力還用于推理計算，可以將其理解為自動化標(biāo)注。以前人工標(biāo)注的速度慢，但精度高。推理計算的標(biāo)注精度低，需要反復(fù)刷標(biāo)提高精度。特斯拉計劃將后臺算力推高至100E（1EFOLPs=10^18次浮點計算）。根據(jù)ChatGPT的經(jīng)驗，訓(xùn)練量達到一定量級，也許會出現(xiàn)大語言模型的“涌現(xiàn)”現(xiàn)象。是否需要與其相當(dāng)?shù)目褚八懔Γ魏稳硕紱]有經(jīng)驗，也沒人宣稱，多少后臺算力就夠了，包括特斯拉自己。

只要想自己搭建訓(xùn)練和推理系統(tǒng)，買算力卡的費用絕對省不了。考慮到英偉達H100，甚至閹割版H800/A800，包括同樣能力的AMD，對中國禁售措施越來越嚴(yán)格，各家如何搭建算力，是一個很有意思的問題。

4月份的時候，特斯拉在Q1財報會議上透露將AI訓(xùn)練集群擴展到35000塊H100算力卡。而同期國內(nèi)能買到1000塊算力卡的廠家，都是鳳毛麟角。

華為的昇騰910B（按照性能最強的910 Pro B），性能據(jù)說和H100的算力差不多。但最緊要的并非峰值算力，而是FLOP利用率。英偉達的算力卡FLOP利用率出了名的低（FP8模型35%左右）。而昇騰系列的問題是產(chǎn)能供不應(yīng)求，一塊昇騰910 ProB一度炒至28萬元。

假設(shè)國內(nèi)企業(yè)的模型設(shè)計水平，與特斯拉相當(dāng)，而昇騰系列算力卡優(yōu)于英偉達一倍以上（這一點存疑），那么想達到特斯拉FSD V12的水平，至少也需要1萬塊以上910B算力卡。

江湖傳聞，910B的2023年出貨量大概50萬塊，這些卡被誰買走了，缺乏信源。基于眾所周知的原因，華為對高制程芯片的生產(chǎn)細節(jié)諱莫如深。

圖：算力中心

種種跡象表明，能夠攢起萬塊以上算力卡的主機廠和供應(yīng)商，國內(nèi)一只手就能數(shù)過來。遠不像場面上人手一份“端到端”那么花團錦簇……

如果這是一場看不見上限的軍備競賽，不考慮成本的話顯然越高越好。顯然，國內(nèi)廠商中間，華為確定有能力跟一下，其他主機廠和模型供應(yīng)商都需要買卡。如果訓(xùn)練相當(dāng)于挖礦，英偉達被定位“賣鏟子的”，那么華為一面賣鏟子，一面也自己動手挖礦，因此獲得了額外的算力供應(yīng)鏈優(yōu)勢。

算力比拼正在演化為各家投資力度競賽，沒有取巧之機。

插混香餑餑，跨國車企必須得與自己和解時髦的“端到端”智駕，走到哪一步了馬斯克兜售的夢，圓在中國

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.