10月29日,小米在發(fā)布會上表示10月30日在全國范圍內(nèi)部署城區(qū)NOA。而“端到端”將在11月底內(nèi)測,12月底推送先鋒版。其實,今年夏天開始,“端到端”智駕就成了業(yè)內(nèi)最火的概念。就在小米發(fā)聲前一周,理想汽車也剛剛宣布了自己的端到端進程。
小米還在瘋狂趕工中的“端到端”,是“一段式”(感知和規(guī)控合為一體),還是“兩段式”(感知和規(guī)控模塊分開,中間嵌入人工接口),目前沒有公開信息。不過,9月份小米將原來“感知”和“規(guī)控”兩個二級部門合并為“端到端算法與功能部”。組織架構(gòu)的變化,暗示小米至少將“一段式”作為目標(biāo)。
截至目前,已經(jīng)有十幾家主機廠和供應(yīng)商,聲稱上馬或者即將上馬“端到端”,以至于這個概念,從新鮮到濫俗,只花了不到1年時間。不管有沒有,都得說有。看如今的流量打法,嘴上輸了就等于“輸陣”。閩南人說“輸人不輸陣,輸陣歹看面”。對潛在受眾和自家團隊構(gòu)成士氣打擊,不是小事。
![]()
圖:一段式端到端示意圖
“一段式”和“兩段式”,雙方旗鼓相當(dāng)
目前,聲稱已部署“一段式”端到端的供應(yīng)商,只有Momenta。智己、廣豐、埃安,作為Momenta的客戶,宣布同期部署。就在10月28日舉辦的品牌智能駕駛技術(shù)日上,智己汽車宣布IM AD 3.0完成從“最像人”到“有直覺”的進化,邁入“直覺”智駕新時代。
而表示“即將”部署“一段式”的品牌,則包括理想、小米、商湯科技、元戎啟行等。“兩段式”主機廠和供應(yīng)商似乎數(shù)量更多,目前有小鵬、極氪、極越、魏牌藍山、鴻蒙智行等。
而寶駿作為大疆的用戶,不但部署了卓馭+寶駿云海(參數(shù)丨圖片),還特意標(biāo)明為“中算力兩段式端到端”。
至于華為的鴻蒙系,客戶包括問界、享界、智界、嵐圖、阿維塔、方程豹、廣汽傳祺。東風(fēng)猛士、尊界也宣布了與華為合作的信息,但迄今尚無“端到端”部署規(guī)劃。華為的態(tài)度,暫時未將“一段式”作為目標(biāo)。而且,華為也不認(rèn)為“兩段式”是通往“一段式”的過渡形式。
除此之外,奇瑞、長安啟源、地平線、輕舟智航等,雖然規(guī)劃了端到端,但未說明形式。
到現(xiàn)在為止,端到端領(lǐng)域,看似支持“兩段式”品牌略多于“一段式”。如果將同一供應(yīng)商技術(shù)來源的,都視為一個品牌,兩者幾乎旗鼓相當(dāng)。
在實現(xiàn)高等級自動駕駛諸多技術(shù)路徑當(dāng)中,端到端值得嘗試,很可能不是唯一路徑,甚至不是最優(yōu)路徑。
我們曾提到過,“兩段式”的優(yōu)勢在于,人工接口信息可觀測,但感知輸出的白盒狀態(tài),就意味著信息過濾后存在損失。
而“一段式”和“兩段式”相比,理論上前者信息丟失少,上限應(yīng)該比較高。但鑒于“一段式”可解釋性更差,到底突破什么下限,大家都沒底。因此所有廠商,不管做的是“一段式”還是“兩段式”,無一例外都設(shè)置了兜底規(guī)則(rule-based)。這也意味著“兩段式”同樣存在不可解釋的部分。
數(shù)據(jù)需求決定部署規(guī)模
雖然“端到端”的參數(shù)量只相當(dāng)于中模型,在一枚英偉達Orin-X上就能跑起來,貌似消耗算力不多。但背后必須有大數(shù)據(jù)和大模型支持。數(shù)據(jù)的門檻不僅是對絕對數(shù)量的要求,對于數(shù)據(jù)的分布和多樣性要求也極高,而且還要求是100%的好數(shù)據(jù)(合規(guī)最優(yōu)操作)。
主機廠自研,和由供應(yīng)商推動,最大的區(qū)別不是技術(shù)本身,而是數(shù)據(jù)獲取能力。后者理論上能獲得多個品牌的產(chǎn)品數(shù)據(jù),數(shù)據(jù)量更大。
有人表示,“一段式”端到端應(yīng)部署在20萬元以上中高端車上。現(xiàn)在沒有跡象表明,“一段式”就比”兩段式“需要更大的車端算力和更強的感知能力(比如有無激光雷達)。將端到端能力作為入門級和高配區(qū)分的一個維度,有可操作性,但同時其演化規(guī)律又要求更大的數(shù)據(jù)量,即盡量擴大部署規(guī)模。兩者要求背離。
何去何從,需要掂量一下。當(dāng)前端到端的競爭主軸并非現(xiàn)實商業(yè)利益,而是盡快迭代起來,形成明顯的使用價值。由此可見,即便實地部署了“一段式”端到端,迭代到可用、好用,群眾滿意的地步,也需要長期投入。
算力大比拼
不可否認(rèn),“一段式”模型,設(shè)計源頭就比“兩段式”難度更大,調(diào)參回路更長、落地流程也更艱難一些。
![]()
圖:AlexNet多層神經(jīng)網(wǎng)絡(luò)
設(shè)計一個可工作的神經(jīng)網(wǎng)絡(luò)(模型)需要很多人類智力資源,訓(xùn)練它更復(fù)雜。神經(jīng)網(wǎng)絡(luò)的每一個子網(wǎng)絡(luò),都涉及歸一化、偏差、非線性輸出,校正回歸等一堆問題。而且多層網(wǎng)絡(luò)讓這些問題的復(fù)雜度上升了維度。
訓(xùn)練促使模型從出生到成熟,訓(xùn)練的本質(zhì)是定量分析。如果用5000萬個clips(視頻片段)訓(xùn)練模型20輪,相當(dāng)于分析1B個clips。訓(xùn)練中心算力直接決定系統(tǒng)迭代速度。
![]()
圖:訓(xùn)練系統(tǒng)
而算力還用于推理計算,可以將其理解為自動化標(biāo)注。以前人工標(biāo)注的速度慢,但精度高。推理計算的標(biāo)注精度低,需要反復(fù)刷標(biāo)提高精度。特斯拉計劃將后臺算力推高至100E(1EFOLPs=10^18次浮點計算)。根據(jù)ChatGPT的經(jīng)驗,訓(xùn)練量達到一定量級,也許會出現(xiàn)大語言模型的“涌現(xiàn)”現(xiàn)象。是否需要與其相當(dāng)?shù)目褚八懔Γ魏稳硕紱]有經(jīng)驗,也沒人宣稱,多少后臺算力就夠了,包括特斯拉自己。
只要想自己搭建訓(xùn)練和推理系統(tǒng),買算力卡的費用絕對省不了。考慮到英偉達H100,甚至閹割版H800/A800,包括同樣能力的AMD,對中國禁售措施越來越嚴(yán)格,各家如何搭建算力,是一個很有意思的問題。
4月份的時候,特斯拉在Q1財報會議上透露將AI訓(xùn)練集群擴展到35000塊H100算力卡。而同期國內(nèi)能買到1000塊算力卡的廠家,都是鳳毛麟角。
華為的昇騰910B(按照性能最強的910 Pro B),性能據(jù)說和H100的算力差不多。但最緊要的并非峰值算力,而是FLOP利用率。英偉達的算力卡FLOP利用率出了名的低(FP8模型35%左右)。而昇騰系列的問題是產(chǎn)能供不應(yīng)求,一塊昇騰910 ProB一度炒至28萬元。
假設(shè)國內(nèi)企業(yè)的模型設(shè)計水平,與特斯拉相當(dāng),而昇騰系列算力卡優(yōu)于英偉達一倍以上(這一點存疑),那么想達到特斯拉FSD V12的水平,至少也需要1萬塊以上910B算力卡。
江湖傳聞,910B的2023年出貨量大概50萬塊,這些卡被誰買走了,缺乏信源。基于眾所周知的原因,華為對高制程芯片的生產(chǎn)細節(jié)諱莫如深。
![]()
圖:算力中心
種種跡象表明,能夠攢起萬塊以上算力卡的主機廠和供應(yīng)商,國內(nèi)一只手就能數(shù)過來。遠不像場面上人手一份“端到端”那么花團錦簇……
如果這是一場看不見上限的軍備競賽,不考慮成本的話顯然越高越好。顯然,國內(nèi)廠商中間,華為確定有能力跟一下,其他主機廠和模型供應(yīng)商都需要買卡。如果訓(xùn)練相當(dāng)于挖礦,英偉達被定位“賣鏟子的”,那么華為一面賣鏟子,一面也自己動手挖礦,因此獲得了額外的算力供應(yīng)鏈優(yōu)勢。
算力比拼正在演化為各家投資力度競賽,沒有取巧之機。
插混香餑餑,跨國車企必須得與自己和解時髦的“端到端”智駕,走到哪一步了馬斯克兜售的夢,圓在中國
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.