<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      英偉達(dá)拿出推理版VLA:Alpamayo-R1讓自動(dòng)駕駛AI更會(huì)動(dòng)腦子

      0
      分享至



      一、自動(dòng)駕駛的瓶頸:「看」得見,卻「想」不明白

      當(dāng)今自動(dòng)駕駛模型越來越強(qiáng)大,攝像頭、雷達(dá)、Transformer 網(wǎng)絡(luò)一齊上陣,似乎什么都「看得見」。但真正的挑戰(zhàn)在于:模型能否像人一樣「想明白」為什么要這么開?

      傳統(tǒng)的端到端(E2E)系統(tǒng)雖然能從感知到控制一氣呵成,卻常在「長(zhǎng)尾場(chǎng)景」翻車 —— 比如:

      • 迎面來車違規(guī)左轉(zhuǎn);
      • 行人突然闖入;
      • 臨時(shí)施工、交通標(biāo)志被遮擋。

      這些「極少數(shù)但容易發(fā)生事故」的場(chǎng)景正是當(dāng)前系統(tǒng)的盲點(diǎn)。

      二、Alpamayo-R1:給模型裝上「推理鏈條」

      NVIDIA Research 推出的Alpamayo-R1(AR1),是一種全新的帶有推理能力的視覺 - 語言 - 行動(dòng)模型(Reasoning VLA),讓車輛不只是「執(zhí)行指令」,而是能在決策前「推理出因果關(guān)系」。



      圖 1:Alpamayo-R1 模型架構(gòu)(示意)

      AR1 的核心創(chuàng)新有三個(gè)方面:

      1. Chain of Causation(因果鏈)數(shù)據(jù)集

      AR1 引入了一套全新的數(shù)據(jù)標(biāo)注體系:每一段駕駛數(shù)據(jù)不僅有「做了什么」,還有 「為什么這樣做」。例如:「減速并左變道,是因?yàn)榍胺接兄鷦?dòng)車等紅燈,且左側(cè)車道空閑。」



      圖 2:因果鏈(CoC)標(biāo)注示例

      2. Diffusion-based Trajectory Decoder(擴(kuò)散式軌跡解碼器)

      AR1 引入了一種基于擴(kuò)散模型的軌跡解碼器,它能在實(shí)時(shí)約束下生成連續(xù)、動(dòng)態(tài)可行的駕駛軌跡。該模塊結(jié)合語言推理輸出與物理約束,實(shí)現(xiàn)從推理到控制的無縫銜接。

      3. Multi-Stage Training(多階段訓(xùn)練策略)

      AR1 是基于 NVIDIA 的 Cosmos Reason 模型,這是一種專為物理 AI(Physical AI)設(shè)計(jì)的推理視覺語言模型;并采用多階段訓(xùn)練策略:首先在大規(guī)模駕駛數(shù)據(jù)上做模態(tài)注入,學(xué)習(xí)從視覺到動(dòng)作的基本映射;第二階段在 CoC 因果鏈數(shù)據(jù)上做監(jiān)督微調(diào),顯式教會(huì)模型「先想清楚再開」;最后通過強(qiáng)化學(xué)習(xí)(RL)進(jìn)一步優(yōu)化推理質(zhì)量、推理 - 行動(dòng)一致性和軌跡安全性。

      這種分階段、分目標(biāo)的訓(xùn)練流程,使得模型在開放場(chǎng)景、長(zhǎng)尾危險(xiǎn)場(chǎng)景中都表現(xiàn)的更加穩(wěn)健。

      三、性能飛躍:更穩(wěn)、更準(zhǔn)、更懂你

      在實(shí)驗(yàn)中,AR1 為以下性能帶來了顯著提升:

      • 規(guī)劃精度提升 12%
      • 越界率降低 35%
      • 近碰率降低 25%
      • 推理 - 行動(dòng)一致性提升 37%
      • ? 實(shí)時(shí)性能:99 ms 端到端延遲

      更重要的是,這些提升主要體現(xiàn)在以往最容易出錯(cuò)的「長(zhǎng)尾場(chǎng)景」中 —— 也就是說,它更接近「真正會(huì)判斷的司機(jī)」。

      四、Vision Encoding:高效多相機(jī)時(shí)序感知

      AR1 的輸入由多相機(jī)、多時(shí)序觀測(cè)幀組成,同時(shí)可以選配高層語言輸入(如導(dǎo)航指令或駕駛目標(biāo))。所有輸入(包括歷史自車運(yùn)動(dòng))會(huì)被統(tǒng)一編碼成多模態(tài) token 序列,按時(shí)序和傳感器順序排列,再送入主干模型 Cosmos-Reason 進(jìn)行推理與預(yù)測(cè)。

      在這一過程中:

      • 每個(gè)相機(jī)視角先經(jīng)過輕量級(jí) CNN 與時(shí)間注意力模塊做特征壓縮與時(shí)序建模;
      • 多相機(jī)特征隨后融合為 BEV(鳥瞰圖)表征;
      • 所有模態(tài)(圖像、導(dǎo)航文本、自車狀態(tài))被 token 化后統(tǒng)一輸入 Transformer;
      • 模型的輸出包含三類 token:推理鏈(reasoning traces)、中層動(dòng)作(meta-actions)與未來軌跡預(yù)測(cè)(trajectories)。

      這種統(tǒng)一編碼方式讓模型具備了多模態(tài)語義理解與運(yùn)動(dòng)狀態(tài)感知的「一體化」能力。

      五、數(shù)據(jù)的靈魂:結(jié)構(gòu)化標(biāo)注的革命

      AR1 的 CoC 數(shù)據(jù)集采用「人機(jī)協(xié)同標(biāo)注」機(jī)制:

      • 人工部分:標(biāo)注關(guān)鍵幀、核心因果因素(如紅燈、行人、障礙物),并撰寫推理鏈。
      • 自動(dòng)部分:通過 GPT-5 等大模型自動(dòng)生成初版推理,再由人類審查。
      • 質(zhì)量審核:每條樣本通過因果覆蓋、因果正確性、近因優(yōu)先等四項(xiàng)規(guī)則嚴(yán)格把關(guān)。

      最終形成數(shù)十萬條高質(zhì)量推理 - 行動(dòng)樣本,使 VLA 模型能真正「理解因果,而非記憶現(xiàn)象」。



      圖 3:CoC 數(shù)據(jù)標(biāo)注流程示意圖

      六、Multi-Stage Training:從常識(shí)推理到行為控制

      Alpamayo-R1 的訓(xùn)練分為三個(gè)階段,旨在讓模型從「看懂」到「會(huì)想」再到「能開」。



      圖 4: AR1 訓(xùn)練流程示意圖

      1. 監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT)

      基于 Cosmos-Reason 的預(yù)訓(xùn)練權(quán)重進(jìn)行微調(diào)。該主干模型原本在 370 萬條 VQA 數(shù)據(jù)上后訓(xùn)練(post-training),其中包括 2.47 萬條專為駕駛設(shè)計(jì)的視頻樣本,帶有場(chǎng)景描述、駕駛難度和推理軌跡標(biāo)注,幫助模型建立「物理常識(shí)」和 「因果直覺」。

      此外還構(gòu)建了額外的 10 萬條駕駛樣本,標(biāo)注關(guān)鍵目標(biāo)、交通信號(hào)、因果行為解釋等信息,用于領(lǐng)域自適應(yīng)微調(diào)。

      2. 因果鏈監(jiān)督階段(CoC Supervision)

      引入 CoC 因果鏈數(shù)據(jù)集,顯式監(jiān)督模型的推理輸出,使其能回答「為什么要減速」、「為什么左轉(zhuǎn)」。這一階段通過人工 + 教師模型(如 GPT-5)生成高質(zhì)量推理樣本,使模型在策略學(xué)習(xí)前先獲得強(qiáng)大的語言 - 推理能力。

      3. 強(qiáng)化學(xué)習(xí)后訓(xùn)練優(yōu)化(Reinforcement Learning based Post-Training)。

      在最終階段,英偉達(dá)通過強(qiáng)化學(xué)習(xí)對(duì)模型進(jìn)行策略微調(diào),以進(jìn)一步提升其在推理精準(zhǔn)性、推理–行動(dòng)一致性、軌跡平滑性以及閉環(huán)控制穩(wěn)定性等方面的表現(xiàn)。

      Alpamayo-R1 引入了多維度獎(jiǎng)勵(lì)機(jī)制:包括由專家級(jí)推理模型提供的反饋信號(hào),用于評(píng)估并引導(dǎo)模型生成更具因果邏輯的推理;「推理–行動(dòng)一致性(Reasoning–Action Consistency)」獎(jiǎng)勵(lì),用于鼓勵(lì)模型依據(jù)自身推理合理執(zhí)行動(dòng)作;以及底層安全獎(jiǎng)勵(lì),用以促進(jìn)模型生成更加安全、平滑且可執(zhí)行的運(yùn)動(dòng)軌跡。

      七、未來展望:邁向可解釋的 L4 自動(dòng)駕駛

      AR1 的設(shè)計(jì)理念可以看作是自動(dòng)駕駛從「黑箱」到「白箱」的轉(zhuǎn)折點(diǎn)。

      它不再只是一個(gè)會(huì)開車的 AI,而是一個(gè)能告訴你「為什么這樣開」的駕駛員。

      ? 小結(jié):讓自動(dòng)駕駛「有理可講」

      Alpamayo-R1 的意義不止在性能提升,更在于:它讓 AI 的「推理鏈」與物理世界的「行動(dòng)鏈」形成真正的閉環(huán)。

      當(dāng)車輛能解釋自己的每一個(gè)決策時(shí),才能確保更加安全,信任與普及才會(huì)得以實(shí)現(xiàn)。

      一句話總結(jié):AR1 = 會(huì)開車 + 會(huì)思考 + 會(huì)解釋的自動(dòng)駕駛模型。

      詳細(xì)內(nèi)容請(qǐng)查看:https://research.nvidia.com/publication/2025-10_alpamayo-r1

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      王剛沒想到,離婚24年,成方圓會(huì)以這種方式,給自己上了生動(dòng)一課

      王剛沒想到,離婚24年,成方圓會(huì)以這種方式,給自己上了生動(dòng)一課

      胡一舸南游y
      2026-01-21 21:25:03
      山上徹也被判無期徒刑,日本網(wǎng)民抨擊高市政府

      山上徹也被判無期徒刑,日本網(wǎng)民抨擊高市政府

      中國(guó)青年報(bào)
      2026-01-21 17:45:07
      太陽光到達(dá)地球需上萬年非8分鐘 ,但對(duì)光子來說就是一瞬間的事

      太陽光到達(dá)地球需上萬年非8分鐘 ,但對(duì)光子來說就是一瞬間的事

      宇宙時(shí)空
      2026-01-19 20:50:05
      第四代住宅賣不動(dòng)了?住進(jìn)去才知道的“七宗罪”

      第四代住宅賣不動(dòng)了?住進(jìn)去才知道的“七宗罪”

      室內(nèi)設(shè)計(jì)師有料兒
      2026-01-20 11:23:56
      18歲伊斯蘭少女直播拒戴頭巾,被冷血父親榮譽(yù)處決。

      18歲伊斯蘭少女直播拒戴頭巾,被冷血父親榮譽(yù)處決。

      環(huán)球趣聞分享
      2026-01-07 13:30:09
      漢武帝為什么要閹了司馬遷?真相揭開后,感嘆:換你也要閹

      漢武帝為什么要閹了司馬遷?真相揭開后,感嘆:換你也要閹

      談史論天地
      2026-01-21 17:20:03
      開始回暖!四川人盼的太陽要回來了

      開始回暖!四川人盼的太陽要回來了

      魯中晨報(bào)
      2026-01-21 15:35:12
      創(chuàng)維欲退市,復(fù)牌股價(jià)大漲37%

      創(chuàng)維欲退市,復(fù)牌股價(jià)大漲37%

      21世紀(jì)經(jīng)濟(jì)報(bào)道
      2026-01-21 22:10:12
      急了!阿森納球星公開跪求續(xù)約:我要留隊(duì)奪冠!

      急了!阿森納球星公開跪求續(xù)約:我要留隊(duì)奪冠!

      奶蓋熊本熊
      2026-01-21 07:01:15
      35歲金晨增肥后更驚艷,穿灰色大衣坐公交像少女,美得像換了個(gè)人

      35歲金晨增肥后更驚艷,穿灰色大衣坐公交像少女,美得像換了個(gè)人

      蓓小西
      2025-11-29 08:58:22
      變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個(gè)時(shí)候的欲言又止

      變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個(gè)時(shí)候的欲言又止

      夜深愛雜談
      2026-01-09 21:32:55
      要奪冠?!U23國(guó)足三球大勝越南晉級(jí)亞洲杯決賽,球迷提前“過年”了!

      要奪冠?!U23國(guó)足三球大勝越南晉級(jí)亞洲杯決賽,球迷提前“過年”了!

      上觀新聞
      2026-01-21 04:40:03
      浙江男子失業(yè)一年,躺平出租房,全靠女友養(yǎng)!女友無奈:長(zhǎng)得帥真沒用

      浙江男子失業(yè)一年,躺平出租房,全靠女友養(yǎng)!女友無奈:長(zhǎng)得帥真沒用

      趣筆談
      2025-11-27 10:40:06
      1984年,張宗遜之子張又俠8個(gè)多小時(shí)拿下松毛嶺:預(yù)備隊(duì)還沒上呢

      1984年,張宗遜之子張又俠8個(gè)多小時(shí)拿下松毛嶺:預(yù)備隊(duì)還沒上呢

      歷史龍?jiān)w
      2026-01-20 10:40:11
      要被釋放?吳佩慈婆婆玩金蟬脫殼,早已再婚嫁給小28歲的美國(guó)高管

      要被釋放?吳佩慈婆婆玩金蟬脫殼,早已再婚嫁給小28歲的美國(guó)高管

      安寧007
      2026-01-21 21:36:32
      男生考上北大被父親暴打,走投無路報(bào)警,才知父親真實(shí)身份

      男生考上北大被父親暴打,走投無路報(bào)警,才知父親真實(shí)身份

      紙鳶奇譚
      2024-10-02 19:26:12
      母親是演員,二婚重組嫁翻譯官父親,難怪42歲尼格買提離婚無兒女

      母親是演員,二婚重組嫁翻譯官父親,難怪42歲尼格買提離婚無兒女

      好叫好伐
      2025-12-12 23:53:52
      藥師提醒:銀杏葉片、血塞通、復(fù)方丹參片,心腦血管用藥別再選錯(cuò)

      藥師提醒:銀杏葉片、血塞通、復(fù)方丹參片,心腦血管用藥別再選錯(cuò)

      蜉蝣說
      2026-01-17 18:36:03
      女人陪你去下面三個(gè)地方,就是想要和你越界了,藏不住

      女人陪你去下面三個(gè)地方,就是想要和你越界了,藏不住

      落雪聽梅a
      2025-12-23 12:10:06
      真不識(shí)貨啊!被易立棄用之人,如今場(chǎng)均23分5助,得分排全聯(lián)盟第4

      真不識(shí)貨啊!被易立棄用之人,如今場(chǎng)均23分5助,得分排全聯(lián)盟第4

      金山話體育
      2026-01-21 09:59:14
      2026-01-22 04:03:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12162文章數(shù) 142547關(guān)注度
      往期回顧 全部

      科技要聞

      給機(jī)器人做仿真訓(xùn)練 這家創(chuàng)企年?duì)I收破億

      頭條要聞

      特朗普稱“美國(guó)擁有無人知曉的武器” 克宮回應(yīng)

      頭條要聞

      特朗普稱“美國(guó)擁有無人知曉的武器” 克宮回應(yīng)

      體育要聞

      只會(huì)防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現(xiàn)身嫣然醫(yī)院捐款

      財(cái)經(jīng)要聞

      丹麥打響第一槍 歐洲用資本保衛(wèi)格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價(jià)12.09萬起

      態(tài)度原創(chuàng)

      手機(jī)
      健康
      親子
      公開課
      軍事航空

      手機(jī)要聞

      iPhone越貴越好賣!iPhone18沒有單打孔

      打工人年終總結(jié)!健康通關(guān)=贏麻了

      親子要聞

      永遠(yuǎn)愛你老媽

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:對(duì)美國(guó)的真正威脅是聯(lián)合國(guó)和北約

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久99精品国产99久久6尤物| 亚洲国产成人无码av在线播放| 国产裸拍裸体视频在线观看| 亚洲午夜福利| 国产人妻人伦精品1国产丝袜| 日韩人妻精品中文字幕免费| 我和亲妺妺乱的性视频| 99久久国产综合精品女同| 一区二区无码中出| 一本大道东京热无码aⅴ| 博爱县| 成a人片亚洲日本久久| 丝袜精品字幕| 97精品综合久久| 亚洲精品久荜中文字幕| 国产AV影片麻豆精品传媒| 伊大人香蕉久久网欧美| 好姑娘西瓜在线观看免费| 国产女人好紧好爽| 久久精品国产亚洲AⅤ无码| 成全世界免费高清观看| 无码人妻精品一区二区三区温州| 内射极品人妻| 亚洲综合乱| av熟女一区二区久久| 亚洲永久一区二区三区在线| 无码h片在线观看网站| 国产av天堂亚洲国产av天堂| 伊人久久福利中文字幕| 美女露全乳无遮掩视频| 久久激情人妻中文字幕| 国产又大又黑又粗免费视频| 亚洲黄色片| 国产精品无码久久久久| 国产xxxxxx| 国产精品无码永久免费888| 人妻少妇一区二区三区| 91丨国产丨白浆秘?网站| 国产一区二区亚洲一区二区三区| 亚洲精品天天影视综合网| 玩弄放荡人妻少妇系列|