<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達拿出推理版VLA:Alpamayo-R1讓自動駕駛AI更會動腦子

      0
      分享至



      一、自動駕駛的瓶頸:「看」得見,卻「想」不明白

      當今自動駕駛模型越來越強大,攝像頭、雷達、Transformer 網絡一齊上陣,似乎什么都「看得見」。但真正的挑戰在于:模型能否像人一樣「想明白」為什么要這么開?

      傳統的端到端(E2E)系統雖然能從感知到控制一氣呵成,卻常在「長尾場景」翻車 —— 比如:

      • 迎面來車違規左轉;
      • 行人突然闖入;
      • 臨時施工、交通標志被遮擋。

      這些「極少數但容易發生事故」的場景正是當前系統的盲點。

      二、Alpamayo-R1:給模型裝上「推理鏈條」

      NVIDIA Research 推出的Alpamayo-R1(AR1),是一種全新的帶有推理能力的視覺 - 語言 - 行動模型(Reasoning VLA),讓車輛不只是「執行指令」,而是能在決策前「推理出因果關系」。



      圖 1:Alpamayo-R1 模型架構(示意)

      AR1 的核心創新有三個方面:

      1. Chain of Causation(因果鏈)數據集

      AR1 引入了一套全新的數據標注體系:每一段駕駛數據不僅有「做了什么」,還有 「為什么這樣做」。例如:「減速并左變道,是因為前方有助動車等紅燈,且左側車道空閑。」



      圖 2:因果鏈(CoC)標注示例

      2. Diffusion-based Trajectory Decoder(擴散式軌跡解碼器)

      AR1 引入了一種基于擴散模型的軌跡解碼器,它能在實時約束下生成連續、動態可行的駕駛軌跡。該模塊結合語言推理輸出與物理約束,實現從推理到控制的無縫銜接。

      3. Multi-Stage Training(多階段訓練策略)

      AR1 是基于 NVIDIA 的 Cosmos Reason 模型,這是一種專為物理 AI(Physical AI)設計的推理視覺語言模型;并采用多階段訓練策略:首先在大規模駕駛數據上做模態注入,學習從視覺到動作的基本映射;第二階段在 CoC 因果鏈數據上做監督微調,顯式教會模型「先想清楚再開」;最后通過強化學習(RL)進一步優化推理質量、推理 - 行動一致性和軌跡安全性。

      這種分階段、分目標的訓練流程,使得模型在開放場景、長尾危險場景中都表現的更加穩健。

      三、性能飛躍:更穩、更準、更懂你

      在實驗中,AR1 為以下性能帶來了顯著提升:

      • 規劃精度提升 12%
      • 越界率降低 35%
      • 近碰率降低 25%
      • 推理 - 行動一致性提升 37%
      • ? 實時性能:99 ms 端到端延遲

      更重要的是,這些提升主要體現在以往最容易出錯的「長尾場景」中 —— 也就是說,它更接近「真正會判斷的司機」。

      四、Vision Encoding:高效多相機時序感知

      AR1 的輸入由多相機、多時序觀測幀組成,同時可以選配高層語言輸入(如導航指令或駕駛目標)。所有輸入(包括歷史自車運動)會被統一編碼成多模態 token 序列,按時序和傳感器順序排列,再送入主干模型 Cosmos-Reason 進行推理與預測。

      在這一過程中:

      • 每個相機視角先經過輕量級 CNN 與時間注意力模塊做特征壓縮與時序建模;
      • 多相機特征隨后融合為 BEV(鳥瞰圖)表征;
      • 所有模態(圖像、導航文本、自車狀態)被 token 化后統一輸入 Transformer;
      • 模型的輸出包含三類 token:推理鏈(reasoning traces)、中層動作(meta-actions)與未來軌跡預測(trajectories)。

      這種統一編碼方式讓模型具備了多模態語義理解與運動狀態感知的「一體化」能力。

      五、數據的靈魂:結構化標注的革命

      AR1 的 CoC 數據集采用「人機協同標注」機制:

      • 人工部分:標注關鍵幀、核心因果因素(如紅燈、行人、障礙物),并撰寫推理鏈。
      • 自動部分:通過 GPT-5 等大模型自動生成初版推理,再由人類審查。
      • 質量審核:每條樣本通過因果覆蓋、因果正確性、近因優先等四項規則嚴格把關。

      最終形成數十萬條高質量推理 - 行動樣本,使 VLA 模型能真正「理解因果,而非記憶現象」。



      圖 3:CoC 數據標注流程示意圖

      六、Multi-Stage Training:從常識推理到行為控制

      Alpamayo-R1 的訓練分為三個階段,旨在讓模型從「看懂」到「會想」再到「能開」。



      圖 4: AR1 訓練流程示意圖

      1. 監督微調(Supervised Fine-Tuning, SFT)

      基于 Cosmos-Reason 的預訓練權重進行微調。該主干模型原本在 370 萬條 VQA 數據上后訓練(post-training),其中包括 2.47 萬條專為駕駛設計的視頻樣本,帶有場景描述、駕駛難度和推理軌跡標注,幫助模型建立「物理常識」和 「因果直覺」。

      此外還構建了額外的 10 萬條駕駛樣本,標注關鍵目標、交通信號、因果行為解釋等信息,用于領域自適應微調。

      2. 因果鏈監督階段(CoC Supervision)

      引入 CoC 因果鏈數據集,顯式監督模型的推理輸出,使其能回答「為什么要減速」、「為什么左轉」。這一階段通過人工 + 教師模型(如 GPT-5)生成高質量推理樣本,使模型在策略學習前先獲得強大的語言 - 推理能力。

      3. 強化學習后訓練優化(Reinforcement Learning based Post-Training)。

      在最終階段,英偉達通過強化學習對模型進行策略微調,以進一步提升其在推理精準性、推理–行動一致性、軌跡平滑性以及閉環控制穩定性等方面的表現。

      Alpamayo-R1 引入了多維度獎勵機制:包括由專家級推理模型提供的反饋信號,用于評估并引導模型生成更具因果邏輯的推理;「推理–行動一致性(Reasoning–Action Consistency)」獎勵,用于鼓勵模型依據自身推理合理執行動作;以及底層安全獎勵,用以促進模型生成更加安全、平滑且可執行的運動軌跡。

      七、未來展望:邁向可解釋的 L4 自動駕駛

      AR1 的設計理念可以看作是自動駕駛從「黑箱」到「白箱」的轉折點。

      它不再只是一個會開車的 AI,而是一個能告訴你「為什么這樣開」的駕駛員。

      ? 小結:讓自動駕駛「有理可講」

      Alpamayo-R1 的意義不止在性能提升,更在于:它讓 AI 的「推理鏈」與物理世界的「行動鏈」形成真正的閉環。

      當車輛能解釋自己的每一個決策時,才能確保更加安全,信任與普及才會得以實現。

      一句話總結:AR1 = 會開車 + 會思考 + 會解釋的自動駕駛模型。

      詳細內容請查看:https://research.nvidia.com/publication/2025-10_alpamayo-r1

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      美媒:中國想干什么就讓他干什么吧!不好辦......

      美媒:中國想干什么就讓他干什么吧!不好辦......

      扶蘇聊歷史
      2025-12-07 11:15:07
      萬科!遭遇反對

      萬科!遭遇反對

      新浪財經
      2025-12-07 18:26:31
      國乒雖然險勝日本,但男隊三大主力都輸了!

      國乒雖然險勝日本,但男隊三大主力都輸了!

      最愛乒乓球
      2025-12-07 08:34:40
      就地處決!聯合國“震驚”,英法德意發表聯合聲明

      就地處決!聯合國“震驚”,英法德意發表聯合聲明

      樂天閑聊
      2025-12-06 10:57:43
      68歲趙本山近況曝光:賣房賣飛機救女,百億身家換不來女兒好睡眠

      68歲趙本山近況曝光:賣房賣飛機救女,百億身家換不來女兒好睡眠

      明月光
      2025-11-22 13:57:08
      中美都在為2026年的大交易做準備。

      中美都在為2026年的大交易做準備。

      一口娛樂
      2025-12-07 10:52:29
      北京第六家蘋果Apple Store零售店開幕

      北京第六家蘋果Apple Store零售店開幕

      三言科技
      2025-12-07 12:34:03
      國家醫保局、人力資源社會保障部印發《國家基本醫療保險、生育保險和工傷保險藥品目錄》以及《商業健康保險創新藥品目錄》

      國家醫保局、人力資源社會保障部印發《國家基本醫療保險、生育保險和工傷保險藥品目錄》以及《商業健康保險創新藥品目錄》

      每日經濟新聞
      2025-12-07 12:09:14
      10輪僅2勝!英超冠軍內訌,頭牌采訪開炮+逼宮主帥下課:有他沒我

      10輪僅2勝!英超冠軍內訌,頭牌采訪開炮+逼宮主帥下課:有他沒我

      我愛英超
      2025-12-07 07:44:46
      快船又一矛盾曝光!泰倫盧暫停布置戰術,哈登坐一旁冷眼旁觀

      快船又一矛盾曝光!泰倫盧暫停布置戰術,哈登坐一旁冷眼旁觀

      體壇小李
      2025-12-07 14:34:17
      2025養老金認證大調整!50-70后必看,4種省心方式+3個關鍵提醒

      2025養老金認證大調整!50-70后必看,4種省心方式+3個關鍵提醒

      冒泡泡的魚兒
      2025-12-07 10:48:45
      4換1!血賺大交易!謝謝你,開拓者!

      4換1!血賺大交易!謝謝你,開拓者!

      籃球實戰寶典
      2025-12-07 00:01:54
      12月7日,31省下發養老金計發基數,最高漲7.99%,一地不重算補發

      12月7日,31省下發養老金計發基數,最高漲7.99%,一地不重算補發

      云鵬敘事
      2025-12-07 10:23:21
      深圳樓市:一大批房子賣不動。。

      深圳樓市:一大批房子賣不動。。

      樓市諸葛
      2025-12-07 20:13:42
      越跌越買!2025社保基金加倉16股權威名單,全球產能隱形冠軍曝光

      越跌越買!2025社保基金加倉16股權威名單,全球產能隱形冠軍曝光

      慧眼看世界哈哈
      2025-12-07 06:00:03
      徹底火了!又一主線開啟新一輪大級別行情!

      徹底火了!又一主線開啟新一輪大級別行情!

      證券市場周刊市場號
      2025-12-07 13:41:21
      打壓歐洲,抑烏親俄,“釜底抽薪”烏克蘭,特朗普的目標是什么?

      打壓歐洲,抑烏親俄,“釜底抽薪”烏克蘭,特朗普的目標是什么?

      山河路口
      2025-12-07 12:40:04
      難怪美航母全部逃離南海!3架墜海飛機撈不回,不能讓中國看笑話

      難怪美航母全部逃離南海!3架墜海飛機撈不回,不能讓中國看笑話

      博覽歷史
      2025-12-06 18:42:27
      藏得挺深!日本掌握的4大頂尖科技,領先全球,你知道幾個?

      藏得挺深!日本掌握的4大頂尖科技,領先全球,你知道幾個?

      墨印齋
      2025-12-01 14:33:17
      首度站在領獎臺創隊史紀錄!德國險勝韓國摘銅成功 決勝局9-0太猛

      首度站在領獎臺創隊史紀錄!德國險勝韓國摘銅成功 決勝局9-0太猛

      顏小白的籃球夢
      2025-12-07 19:36:44
      2025-12-07 22:27:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11862文章數 142509關注度
      往期回顧 全部

      科技要聞

      漲幅最高20%!戴爾、聯想等PC廠計劃漲價

      頭條要聞

      馬克龍剛走德國外長向東出發 10月曾突然取消訪華行程

      頭條要聞

      馬克龍剛走德國外長向東出發 10月曾突然取消訪華行程

      體育要聞

      梅開48度!2年半,這是梅西在邁阿密的一人一城

      娛樂要聞

      林俊杰AAA頒獎禮,韓娛愛豆均站起鞠躬

      財經要聞

      五糧液降價?回應來了

      汽車要聞

      傳奇超跑電動形態重生 雷克薩斯LFA純電概念車

      態度原創

      教育
      藝術
      數碼
      公開課
      軍事航空

      教育要聞

      驚!職校高考喜報名單與百度人名大全高度重合,還列出了高考分數

      藝術要聞

      他單身,偷拍了5萬個姑娘,但所有女人竟都愛他!

      數碼要聞

      OPPO Pad Air換皮?一加Pad Go 2平板細節曝光,兩種配色可選

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      日本自衛隊飛機多次滋擾遼寧艦航母編隊訓練

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产亚洲精品久久久久久久软件| 91免费网站在线观看| 国产精品1区2区3区在线观看 | 黑人大战中国av女叫惨了| ww无码| 亚洲精品乱码久久久久99| 人人妻人人澡人人爽欧美一区双 | 美女又黄又免费的视频| 亚洲成在人线av| 国产成人?综合?亚洲| 99视频在线播放| 99久久99久久久精品久久| 国产品无码一区二区三区在线| 亚洲综合电影| 楚雄市| 中文字幕乱码亚洲中文在线| 国产99视频精品免费视频6| 狠狠躁18三区二区一区| 免费人妻无码不卡中文字幕18禁| 东兰县| 亚洲天堂免费观看| 亚洲中文字幕伊人久久无码| 色一情一乱一乱一区99av白浆| 亚洲va韩国va欧美va| 高白浆久久| 3P性视频| 强奷白丝美女在线观看| 少妇久久久久久被弄到高潮| 精品久久久噜噜噜久久久| 亚洲综合专区| 婷婷成人文学| 91视频免费观看| 亚洲成a人在线播放www| 先锋影音av最新资源| 美女扒开奶罩露出奶头视频网站| 怡红院亚洲| jiZZjiZZ欧美69| 7878成人国产在线观看| 无码视频一区二区三区在线观看| 亚洲一区av在线观看| 性色av蜜臀av色欲av|