![]()
文|劉俊宏
編|王一粟
全球AI頂會上,出現了越來越多中國公司的身影。
在過去,仍然是以阿里、字節等科技公司為主,但近些年正在出現更多來自產業端的聲音。
今年,一家來自中國的車企也站在了ICCV(國際計算機視覺大會)的演講臺上。
![]()
近日,理想汽車自動駕駛高級算法專家詹錕在ICCV發表主題演講《世界模型:讓我們從數據閉環走向訓練閉環》,闡述了理想汽車以“從數據到訓練”的系統化思路,提出了全球首個將世界模型與強化學習閉環落地于量產自動駕駛系統的完整架構。
如果說上一代自動駕駛的“端到端”架構只能讓自動輔助駕駛接近人類水平,那么“世界模型+強化學習”,有希望超越人類。
除了這次分享,僅在ICCV 2025上,理想自動駕駛團隊就有5篇重磅論文入選。而近三年,理想汽車圍繞端到端、世界模型、VLA模型等前沿技術,在多個頂級學術會議發表了近50篇論文。不僅如此,理想汽車將輔助駕駛部分代碼和數據庫開源,獲得超過3200名開發者的收藏或調用。
就在中國開源大模型受到全球關注的同時,中國車企也正在為自動駕駛貢獻中國力量。
找到了正確的技術路徑,理想汽車的自動駕駛技術進步飛快。從“端到端+VLM”到VLA,理想汽車僅用了一年的時間,平均接管里程提升了近20倍。
理想汽車今年又發布了基于“VLA司機大模型”的下一代輔助駕駛技術,而VLA將成為實現L4級別自動駕駛的關鍵。
可以看到,理想汽車這種從數據到訓練的閉環,既是中國科技公司務實主義的體現,又是智能汽車贏得智能化市場的戰略底氣。
![]()
就如理想汽車董事長兼CEO李想所言:“任何時候當我們想去改變和提升能力,第一步一定是搞研究,第二步是研發,第三步是把能力表達出來,第四步是能力變成業務的價值。這四個步驟是個極簡的人類最佳實踐。”
華山論劍,理想公開訓練秘籍
站在AI大牛云集的ICCV 2025上,理想也能和其他頂尖AI公司一起華山論劍。
今年,理想拿出了一個有分量的分享——首個將世界模型與強化學習閉環落地于量產自動駕駛系統的完整架構。
![]()
ICCV上,理想分享的這套架構以世界模型為核心,靠區域級仿真、合成數據生成和強化學習三項關鍵技術,最終實現高效的自動駕駛系統開發工作。
這套架構,就是理想從2024年便開始預研的“VLA司機大模型”。
回顧理想發展的前兩個關鍵階段,從2021年啟動自研輔助駕駛系統開始,理想完成了從規則控制的獨立模塊架構進化到端到端架構的落地。2024年,“端到端+VLM視覺語言模型”雙模型的推出,就是彼時理想的一次階段性成果。
但理想并不滿足于此,具身智能領域的進化,讓理想看到了輔助駕駛進化的可能性。
不過,要想快速做出更好的新模型,理想在上一代中就發現了一個問題——真實數據能解決的問題范圍,越來越有限了。
雖然通過收集真實數據+前沿模型率先落地的方式,理想的數據飛輪得以越滾越快。然而在學習過程中,他們也察覺到了真實數據的缺陷,即這些數據本身難以覆蓋足夠的場景分布。
也就是說,在數據類型有限的情況下,AI漸漸學不到新東西了。
為突破瓶頸,理想決定將單一的數據閉環向更系統的訓練閉環演進,給出了更聚焦、更全面的訓練思路。
從數據端,理想選擇采用大量仿真數據。簡單來說,就是之前輔助駕駛訓練是“有什么數據就鍛煉哪些能力”,現在則是設定好新目標,通過合成特定數據,再用這些仿真數據支撐模型訓練,實現“按需訓練”。
數據有了,在哪訓練更合適?為了給自動駕駛搭建“專屬的訓練場地”,理想引入了作為訓練閉環的核心——世界模型,它擔起了訓練、數據和強化學習三塊關鍵任務。
首先,世界模型能提供一套仿真系統,讓輔助駕駛模型能在模擬環境中“暢跑”。接下來,理想會在世界模型中添加合成數據,給輔助駕駛模型的“道路”添加場景和障礙物。最后,理想使用強化學習給輔助駕駛模型設計目標,直到訓練完成。
在這套完整的框架里,理想還給出了一系列配套技術。例如能生成道路場景的場景重建、多傳感器渲染、多模態生成技術;讓合成數據“動起來”的交通智能體、3D資產庫;還有給模型“打分”的評價反饋系統。
事實證明,全新的技術路線能顯著加快輔助駕駛模型的迭代速度。
今年七月底,光錐智能受邀參與理想VLA司機智駕體驗日時,理想汽車自動駕駛研發高級副總裁郎咸朋分享了一個案例。在一個汽車左轉的場景中,VLA模型僅用了13輪訓練就通過了原本“撞車”的場景,隨后在第二十輪“畢業”。
順著這條思路,理想還發現仿真環境訓練能為輔助駕駛研究省下大把的開銷。
“從2024年做端到端的時候,平均下來成本降到了5塊錢一公里,”郎咸朋說,“現在的VLA,我們都是用仿真測的,5毛錢一公里,就是付個電費,付個服務器的費用。并且測試質量還高,所有的case、所有的場景都能舉一反三,可以完全復測,分毫不差。”
由此,距離上一代模型不到一年,理想在今年進一步推出了VLA司機大模型,一是借用大模型的能力,讓輔助駕駛像人類一樣深思熟慮地駕駛;二是通過這套融合強化學習與訓練閉環體系的全新架構,提升模型的智能上限。
![]()
不過,在這條尚屬空白的領域中,要交給理想蹚過的河還有很多。詹錕也在ICVV上指出,由于強化學習引擎對泛化性、時效性和并發度均有較高要求,理想汽車正持續推進這一技術難題的攻關與突破。
VLA更關鍵的意義,是讓理想看到了輔助智駕在進入平穩期之后,突破至下個里程碑的可能性。
“上一代技術能力的上限,是下一代技術能力的起點。”郎咸朋預測,通過上述訓練方式,理想有機會讓輔助駕駛能力飛躍一個量級。
“如果MPI(平均接管里程)真正能提升到1000公里,就意味著系統可能真的是兩三個月才接管一次,這可能意味著輔助駕駛邁入到下一個時代了。”郎咸朋說。
自動駕駛技術的“乘數效應”
作為一名車企,理想已經是AI國際學術會議上的“常客”了。
近年來,圍繞端到端、世界模型、VLA(視覺-語言-行動)等前沿方向,理想已經在CVPR、ICCV、ECCV、ICRA、CoRL、NIPS等國際頂級學術會議上發表了近50篇論文。
![]()
“任何時候當我們想去改變和提升能力,第一步一定是搞研究,第二步是研發,第三步是把能力表達出來,第四步是能力變成業務的價值。這四個步驟是個極簡的人類最佳實踐。”李想分享過從技術到業務價值的方法論,這也成了理想做技術投入的準繩。
正是基于這些基礎研究,才促成了理想輔助駕駛2年三次迭代,從“追趕者”搖身一變成為行業的頭部。
每一次業務價值的突破,都能在技術研究中找到源頭活水。
比如,當自動駕駛進入端到端技術時代后,如何高效利用海量的駕駛數據,如何構建高質量的訓練場景,成為所有車企面臨的共同挑戰。
于是,2023年10月,理想在ECCV 24會議上提出了StreetGaussians技術,提出了一種能夠快速構建并實時渲染的動態場景表示方法,讓實時渲染場景走入現實。這項技術不僅為理想的端到端+VLM雙系統輔助駕駛提供了高效迭代的數據基礎,還為自動駕駛仿真訓練提供了技術支持。
2025年6月,理想聯合悉尼科技大學發布了業界首個大規模真實3D車輛數據集3DRealCar。和以往要么來自合成、要么低質量的數據集相比,這個數據集做到了高質量(100+不同品牌汽車)、高數量(2500+輛汽車)。它還采用了完全開放且可商用的Apache 2.0協議,從而迅速被行業頭部公司采用。
優質數據有了、訓練效果提升了,理想開始著手讓模型學會“自進化”,加速模型的迭代效率。
這就是2025年6月,理想World4Drive技術的由來。這是業界首個通過自監督學習實現無需感知標注的端到端框架。
對比傳統的自動駕駛系統需要大量人工標注數據來訓練感知模塊,World4Drive則通過自監督學習構建潛在世界模型,讓系統直接從原始駕駛數據中學習如何規劃路徑,從而加速了模型的迭代效率。
這種讓訓練流程變成“自動化流水線”的能力,正是當前大模型時代最具價值的技術方向。
![]()
這些看似分散的基礎研究,最終匯聚成了理想今年的核心成果——VLA司機大模型,通過加速模型訓練效率和質量的方式,加以強化學習能力,讓模型變得更“聰明”。
基礎技術的積累最終觸發了“乘數效應”,在經濟學中,最初投資的增加引起的一系列連鎖反應,會帶來收入的數倍增加。一項項技術累積,則成為了理想被用戶選中的基點。
輔助駕駛的使用數據,是最好的佐證。截至2025年10月17日,理想用戶輔助駕駛累計用戶達到140萬人,輔助駕駛累計里程達到53.7億公里,主動安全累計避免潛在事故1036萬次。
將用戶安全、順暢地送到目的地,是用戶選購理想汽車最大的期望。
李想的AI理想,從成就自我到惠及行業
中國的智能汽車,正在重走喬布斯的來時路。
1993年,喬布斯關閉了NeXT電腦的硬件部門,轉向到純軟件公司。面對這場失敗,喬布斯承認硬件創新的“壁壘”很低,“在硬件方面,你再也無法構建一臺比別人好兩倍的計算機了。太多人知道怎么做了。你很幸運如果能做出比別人好1.3倍或1.5倍的機器,而且其他人只需6個月就能趕上。”
硬件競爭到最后,比拼的還是軟件。
中國智能汽車發展初期,理想用“冰箱彩電沙發”的配置率先贏得了市場。但短短幾年之后,豪華內飾就成為了“稀松平常”。當下的智能汽車行業,開始轉向強調AI的價值。
例如傳統豪華汽車品牌寶馬、奔馳、奧迪的智能化轉型第一步,就包含用豆包大模型改造智能座艙。理想在發布代表intelligence(智能)的理想i8時,發布會用了三分之二的時間談了VLA司機大模型和Agent智能座艙。
既然AI是未來,那就重金投入。
據李想透露,理想在AI模型、算力以及基建方面,一年投入了60多億。雖然燒錢,但李想認為這一切都十分值得。“它短期不產生直接商業回報,金額巨大。但若不投入,AI就無從談起,投機取巧做不了AI。”
![]()
有舍才有得。中國古老的處世哲學,正在映照在AI領域上。
中國的開源大模型,在國際得到的認可度越來越高,除了商業模式之外,這種開放共贏的心態,也是每個有追求的創業者“兼濟天下”的理想。
從中國互聯網行業剛起步時期就開始創業,至今已經20多年的李想也有更高的追求。于是,在技術路線上,理想汽車一直都在毫不吝嗇地開源。
在自動駕駛領域,理想一直在開源。理想開源的LiAutoAD倉庫,分享端到端代碼和基礎模型,被3200+開發者調用。自2021年以來,理想汽車圍繞BEV(Bird's-eye-view,鳥瞰圖)、端到端模型、VLM視覺語言模型、VLA模型、強化學習、世界模型、AI基座模型等領域,發表近50篇論文,被引用超過2400次。
在汽車操作系統領域,理想今年也開源了自研的汽車操作系統星環OS。該系統研發的初衷,是用統一的操作系統打通各個汽車控制器,實現極致的軟件效率。
開源之后的效果,理想汽車星環OS的架構負責人黃震認為,是解了行業的“燃眉之急”,“反饋比我們想象中積極。很多車企現在還沒有做自研操作系統,不是認為沒必要,而是一開始可能沒騰出手來想這件事。”
9月16日,理想與長城汽車、英飛凌、中科創達、德賽西威等共16家生態伙伴與理想共同簽署《星環OS社區章程》。標志著星環OS正式從理想內部走出,成為汽車廠商打造汽車智能的選擇。
從技術到經濟,無疑都是越開放、越上升,越合作、越共贏。
DeepSeek一開源就名揚天下,推動了整個中國AI向前發展快了大半年;阿里通義千問的開源,也被英偉達黃仁勛盛贊沖到全球開源模型榜第一。
“如果沒有開源,AI又怎能取得近年來如此巨大的進步呢?開源能夠吸引各類公司的參與,從而保持生態系統的創新性、安全性和責任感。它讓成千上萬的研究人員得以投身于AI創新之中。”英偉達CEO黃仁勛曾發出的感嘆。
更開放的理想汽車,正在成就更多人的理想。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.