![]()
![]()
“全球首個具備思考與推理能力的自動駕駛AI”來了。
作者|王博
自動駕駛行業,正在進入一個微妙卻關鍵的階段。
一方面,越來越多的自動駕駛系統(包括輔助駕駛系統、智能駕駛系統)已經能在大多數時間里“把車開好”:在高速公路、城市主干道,以及熟悉的路況中,它們已經接近人類司機的平均水平。
但另一方面,行業內部對一個問題的焦慮卻從未消失——當自動駕駛系統面對未見過的情況時,它究竟是怎么做出決定的?
北京時間今天凌晨,在美國拉斯維加斯CES現場,英偉達發布Alpamayo系列開源AI模型、仿真工具及數據集,旨在推動安全可靠的推理型自動駕駛汽車開發。
英偉達CEO黃仁勛在演講中更是直呼Alpamayo是“全球首個具備思考與推理能力的自動駕駛AI”。
自動駕駛系統是如何思考并決策的呢?Alpamayo,正是一次對這個核心問題的正面回應。
1.一個長期被回避的問題:車是“怎么想的”?
過去一年,關于自動駕駛的評測和爭議不斷。
去年7月,在懂車帝發布的智駕評測視頻中,36輛來自不同品牌不同型號的車在面對模擬事故場景時,處理方式各異。即使是采用同一套智駕方案的不同車型,在面對同一模擬事故場景時也會“糾結”。有的車型還會在發生碰撞前的幾秒鐘退出智駕,要求駕駛員接管處理。
![]()
![]()
《懂車智煉場》智駕測試,圖片來源:懂車帝B站賬號
有的車芯片算力高,有的車傳感器多,有的車攝像頭及算法先進,有的車數據來源豐富。車企和自動駕駛廠商不斷在宣傳配置,展示能力,但是很少有企業說明白:車是“怎么想的”。
回顧自動駕駛的技術演進,可以發現一個清晰的脈絡。
最早的階段,行業關注的是能不能看見:傳感器如何融合?目標如何識別?障礙物如何分類?
隨后,問題變成了能不能跑得穩:路徑規劃是否平滑?控制是否魯棒?系統是否足夠可靠?
而最近幾年,隨著端到端模型和大規模數據的引入,行業開始追求能不能開得像人。
但在這一過程中,有一個問題始終被“技術性回避”了:系統的決策邏輯,是否可以被理解、復盤和解釋?
在很多現有方案中,決策是隱式存在的。模型做出了一個動作,但并不會告訴你:它關注了環境中的哪些關鍵信息?它如何權衡了風險與收益?它為什么沒有選擇另一條看似合理的路徑?
Alpamayo的出現,本質上是英偉達對這一問題的回應。
根據英偉達發布的技術介紹,Alpamayo將開源模型、仿真框架與數據集三大支柱整合為統一開放的生態系統,任何汽車開發者或研究團隊均可在此基礎上進行研發。
![]()
Alpamayo的核心組件,圖片來源:英偉達
在開源模型方面,英偉達推出了Alpamayo 1。英偉達介紹,這是業界首款面向自動駕駛研究社區設計的思維鏈VLA(視覺-語言-動作)推理模型,現已在Hugging Face上發布。
Alpamayo 1擁有100億參數,可通過視頻輸入生成行駛軌跡,同時給出推理思路,能夠清晰展示每項決策背后的邏輯。
開發者既可將Alpamayo 1調整為更精簡的運行時模型部署于車端,也可將其作為自動駕駛的基礎架構,構建諸如基于推理的評估器和自動標注系統等開發工具。Alpamayo 1提供開放模型權重和開源推理腳本。該系列的后續模型將具備更大的參數規模、更精細的推理能力、更靈活的輸入輸出方式以及更豐富的商用選項。
英偉達同步發布了一款面向高保真自動駕駛開發、完全開源的端到端仿真框架AlpaSim,現已在GitHub上公開。該框架可提供逼真的傳感器建模、可配置交通動態,以及可擴展的閉環測試環境,支持快速驗證與策略優化。
此外,英偉達還提供了物理AI開放數據集,這是一個多元化的大規模自動駕駛開放數據集。該數據集包含超過1700小時的駕駛數據,覆蓋廣泛的地理區域和環境條件,涵蓋推動推理架構發展所必需的罕見且復雜的真實世界極端場景。目前,該數據集已在Hugging Face上開放使用。
這些工具共同構建了一個自我強化的開發閉環,用于推理型自動駕駛堆棧的開發。
從形式上看,這并不陌生。過去幾年里,模型、仿真和數據早已是自動駕駛系統的“標配”。
真正不同的是,Alpamayo補上一個長期缺位的能力層:推理。
在英偉達的敘事中,自動駕駛不再只是一個從感知到控制的流水線,而是一套具備理解、思考與決策能力的系統。
2.拆解Alpamayo
Alpamayo 1并不是直接部署于車端的模型,而是作為大規模教師模型(large-scale teacher models),供開發者調優、蒸餾,成為其完整自動駕駛技術棧的核心基礎。
從模型整體架構看,Alpamayo 1被設計為一個清晰分層的自動駕駛系統,由視覺、推理和行動三個部分構成。這種結構反映了英偉達對自動駕駛問題的一個核心判斷:在感知與控制之間,引入獨立的推理層,有助于提升系統在復雜和長尾場景中的決策能力。
![]()
Alpamayo 1模型架構,圖片來源:英偉達
在底層,Alpamayo 1通過視覺與文本編碼器處理來自多攝像頭、多時間步的圖像輸入,同時融合導航信息、用戶指令以及車輛自身的歷史狀態。該模塊強調高效的上下文編碼,通過對多模態信息進行壓縮和結構化,控制序列長度和計算成本,為后續推理階段預留足夠的算力空間。
系統的核心位于中間的推理層。Alpamayo 1引入了基于互聯網規模數據預訓練的推理骨干網絡,并通過帶有可驗證獎勵的強化學習,將通用的因果推理能力遷移到真實駕駛情境中。這一層負責對當前交通環境進行理解和判斷,為后續決策提供明確的推理依據。
在行動層,模型先形成接近人類駕駛策略的高層決策,再由軌跡解碼模塊生成具體行駛路徑。整個軌跡生成過程受到推理結果的約束,使決策與執行之間保持一致,從而提升行為質量與可解釋性。
而在訓練方面,Alpamayo 1結合了模仿學習、監督微調和強化學習等多種信號,對齊推理過程與行動結果。推理能力因此成為一個可訓練、可評估的系統組件,而不再只是隱含在模型內部的黑盒過程。
整體而言,Alpamayo 1的架構嘗試將駕駛中的理解與決策過程顯性化,并以工程化方式嵌入自動駕駛系統之中。這一設計思路,也構成了黃仁勛所強調的“全球首個具備思考與推理能力的自動駕駛AI”的技術基礎。
![]()
搭載Alpamayo的奔馳CLA在實際道路測試,圖片來源:英偉達
在通用大模型領域,思維鏈(Chain-of-Thought)往往被理解為“讓模型回答得更好”。但在自動駕駛領域,它是一條可追溯的推理鏈,可以對事故或險情進行因果分析,在仿真中比較不同決策路徑,為安全認證提供依據并減少對人工規則的依賴。
值得注意的是,Alpamayo 1的參數規模是100億(10B),這并不是一個很大的模型。
克制的規模,指向工程現實:Alpamayo 1希望成為一個可以嵌入現有架構的推理中樞。
從仿真框架來看,傳統仿真系統關注的是結果是否符合預期,而行業如今更需要關注的是決策過程是否合理。
Alpamayo此次同步發布的端到端仿真框架AlpaSim就支持對同一場景進行多策略回放、反事實測試,以及推理路徑對齊,這使得仿真從“驗證結果”升級為“驗證邏輯”。
值得關注的是,英偉達此次發布的自動駕駛數據集,強調覆蓋復雜地理、氣候和駕駛文化差異,其數據結構更偏向語義和情境,而非單純的感知標注。這意味著,模型訓練的目標更偏重于理解場景。
相比特斯拉FSD強調數據規模和隱式學習,英偉達Alpamayo則強調顯式推理與可解釋性;相比Waymo強調規則和地圖,Alpamayo則試圖用推理模型,承擔一部分規則難以覆蓋的工作。
當然,這些并非簡單的技術主義對立,而是代表了不同的風險管理哲學。
「甲子光年」認為,在一個仍處于快速演進中的行業里,與其陷入非此即彼的路線爭論,不如回到工程與風險本身,觀察不同體系各自試圖解決的問題。
過去十多年,英偉達始終站在自動駕駛產業鏈的基礎層,提供算力、工具、服務幾乎所有自動駕駛路線,這讓英偉達能夠在不綁定單一路線的前提下,對行業瓶頸做出判斷。
Alpamayo,本質上是英偉達站在“系統工程視角”給出的答案。
3.英偉達開源之后
在Alpamayo發布后,國內自動駕駛圈內很快有人開始討論:英偉達這次是不是真的把自動駕駛模型“開源”了?相關廠商和研發者會不會因此受益?
在官方新聞稿中,英偉達多次使用了 “open-source”“open models”“open ecosystem” 等表述,從目前已公開的信息來看,「甲子光年」認為,這接近于一種分層、有邊界的開源。
一方面,英偉達已將Alpamayo-R1的核心代碼在GitHub上以Apache-2.0協議公開,包括推理實現、示例腳本和開發工具。這意味著研究人員和開發者可以自由查看、修改和擴展其推理邏輯,在技術層面具備了真正的開源屬性。同時,AlpaSim仿真框架也以完整開源的形式發布,鼓勵社區參與驗證和二次開發。這些舉措,使Alpamayo不再只是一個封閉平臺或黑盒模型,而是具備可復現、可討論、可演進的工程基礎。
但另一方面,英偉達對模型權重和產業級使用仍然保留了明確的許可邊界。Alpamayo的模型權重雖可下載和實驗,但其使用條款更偏向研究和開發場景,并不等同于“可直接用于量產自動駕駛系統”的自由授權。官方倉庫也明確強調,Alpamayo是一套用于探索推理型自動駕駛的基礎構件,而非經過完整安全驗證的商業級自動駕駛棧。
從這個角度看,英偉達的“開源”并非理想主義式的全面放權,而是一種高度工程化、面向生態協作的開放策略:開放方法論、開放工具和關鍵實現,推動行業在同一技術范式下前進,同時對商業化和安全責任保持必要控制。
不過Alpamayo已經是英偉達在自動駕駛領域,迄今為止“開放程度最高”的一次嘗試。英偉達通過Alpamayo在自動駕駛領域釋放了一個非常清晰的信號:推理方法、仿真驗證和工程實現,應該成為行業的公共討論基礎。
![]()
Alpamayo,圖片來源:英偉達
值得注意的是,Alpamayo沒有站在傳統模塊化或純端到端的任何一端。
它保留了端到端模型在感知與理解上的優勢,同時又在中間顯式引入推理層,對決策過程進行結構化。這種設計,為長期陷入對立的技術路線提供了一種新的參考解法:端到端可以存在,但推理不必是黑盒。
這意味著,行業里的路線之爭,可能逐步從“架構宗教”轉向更現實的問題:哪些能力必須顯性化?哪些可以繼續交給數據和模型隱式學習?
雖然Alpamayo沒有給出明確答案,但它提供了一個可驗證的樣本。
從產業結構看,Alpamayo的發布,也意味著英偉達在自動駕駛領域的角色發生了微妙變化。
過去,英偉達更像是算力和工具的提供者,為不同路線“供能”;而現在,英偉達則更進一步,開始對“自動駕駛該如何被構建”提出明確方法論。
如果說過去十年,是自動駕駛的“感知時代”,那么英偉達通過Alpamayo試圖開啟的,是一個更復雜、也更現實的階段——
自動駕駛,終于開始講道理了。
(封面圖為黃仁勛在CES 2026上的演講,來源:英偉達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.