車東西(公眾號:chedongxi)
作者 | Janson
編輯 | 志豪
英偉達要用“因果推理”重塑L4自動駕駛?!
車東西12月3日消息,日前,英偉達(NVIDIA)研究團隊正式發布并開源全新的視覺-語言-動作(VLA)模型Alpamayo-R1,并明確宣布計劃在未來的更新中開源該模型及部分核心數據集。
![]()
▲Alpamayo-R1對應的數據集已上傳至開源社區
目前,該模型對應的數據集也已上傳至開源社區,總大小約100TB,這也是英偉達首次將VLA模型進行開源。
![]()
▲Alpamayo-R1模型架構
這一舉措不僅打破了高端自動駕駛模型的封閉高墻,更標志著端到端自動駕駛技術從單純的“模仿行為”邁向了具備深層“因果思考”的新階段。
對于自動駕駛行業而言,Alpamayo-R1的出現直擊了當前最令人頭疼的痛點——長尾場景(Long-tail scenarios)下的安全性。
英偉達此次帶來的 Alpamayo-R1正是為了終結這一困境,而其交出的實測成績單也足夠令人信服。
![]()
▲Alpamayo-R1相對基線的提升明顯
在針對極高難度長尾場景的測試中,AR1的規劃準確率相比僅有軌跡預測的基線模型提升了整整12%;
在閉環仿真測試里,AR1成功將車輛沖出道路的事故率降低了35%;
與其他車輛或行人的近距離危險遭遇率也大幅減少了25%。
更值得一提的是,即便在集成復雜的推理大腦后,該模型在NVIDIA RTX 6000 Pro Blackwell車載硬件上依然保持了99毫秒的端到端超低延遲,完全滿足了實時自動駕駛的嚴苛需求。
一、解決自動駕駛端到端黑盒問題 引入因果鏈數據集
過去幾年,基于模仿學習的端到端大模型雖然通過堆砌數據量取得了顯著進步,但它們本質上更像是一個只會死記硬背的“黑盒”。
這些模型能夠精準模仿人類駕駛員的操作,卻缺乏對場景的因果理解。它們知道“前面有車要剎車”,卻不知道“為什么要剎車”。
這種知其然不知其所以然的缺陷,導致車輛在面對從未見過的高風險復雜路況時,往往表現脆弱,決策邏輯甚至自相矛盾。
為了讓AI真正學會像人類老司機一樣思考,英偉達并沒有選擇在現有模型上修修補補,而是從最底層的數據構建開始了一場革命。
![]()
▲因果鏈推理演示
為了解決傳統數據集中描述模糊、缺乏邏輯關聯的問題,研究團隊構建了一套全新的“因果鏈”(Chain of Causation, CoC)數據集。
這套數據集的核心在于教會模型建立“觀察-原因-決策”的嚴密邏輯閉環。它不再讓AI生成諸如“天氣晴朗、路面寬闊”這類無關痛癢的旁白。
在這套模型下,提示詞可明確指出“因為左側有車輛正在強行并線,且前方有行人橫穿,所以我決定減速避讓”。
這種數據構建方式不僅消除了因果混淆,更有效提升了模型的邏輯性。
二、引入新架構 平衡模型性能
在強大的數據支撐下,Alpamayo-R1采用了一種模塊化且高效的架構設計,巧妙地平衡了“慢思考”與“快行動”。
其大腦由英偉達專為物理AI打造的Cosmos-Reason視覺語言模型驅動,負責處理復雜的環境理解和邏輯推理。
而行動則交由一個基于流匹配(Flow Matching)技術的動作專家解碼器來控制。
這種分工合作的機制,讓模型既能利用大語言模型的廣博知識進行深思熟慮,又能通過擴散模型生成絲般順滑且符合車輛動力學的行駛軌跡,完美解決了大模型通常反應遲鈍的弊病。
不過,真正讓Alpamayo-R1與眾不同的,是其在訓練階段引入的強化學習(RL)機制。
![]()
▲推理-動作高一致性將提升獎勵
在監督學習教會模型基本的駕駛技能后,研究人員引入了一個更為嚴苛的“判卷老師”——利用更大規模的推理模型作為批評者(Critic),對AR1的表現進行打分。
這個階段的訓練目標非常明確——要求模型言行一致。
對此,該模型中的獎勵函數不僅看重車輛是否開得安全,更看重模型嘴上說的推理邏輯與實際做出的駕駛動作是否吻合。
如果模型推理說“因為紅燈要停車”,但實際動作卻在加速,它就會受到嚴厲懲罰。
![]()
▲采用強化學習新模式后質量顯著提升
這種訓練方式讓AI的解釋不再是一種事后的敷衍,而是真正成為了指導車輛行動的決策綱領,推理質量因此提升了45%,推理與行動的一致性也提高了37%。
在論文的最后還有一個小彩蛋,致謝中排在第一位的正是英偉達自動駕駛負責人吳新宙。
![]()
▲吳新宙在致謝第一位
結語:英偉達首次開源VLA模型
隨著 Alpamayo-R1 的發布及后續開源計劃的推進,英偉達不僅展示了一條通往 L4 級自動駕駛的務實技術路徑,更為整個開源社區注入了強勁動力。
當自動駕駛汽車開始能夠清晰地解釋自己的每一個決策邏輯時,我們距離那個真正安全、可信的自動駕駛未來,或許只剩下最后的一公里。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.