<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      為什么把VLA直接放上自動(dòng)駕駛汽車沒那么容易?

      0
      分享至

      [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛領(lǐng)域,經(jīng)常會(huì)有技術(shù)提出將VLA(視覺—語言—?jiǎng)幼髂P停?yīng)用到自動(dòng)駕駛上。VLA的作用就是把看、懂、決策三件事交給一個(gè)大模型,攝像頭看到畫面,模型用“視覺+語言”去理解場(chǎng)景和意圖,最后直接輸出要不要轉(zhuǎn)向、踩剎車這樣的動(dòng)作。這個(gè)模型的好處顯而易見,模型能用更豐富的語義理解來輔助決策,理論上更靈活、更接近“人怎么想就怎么做”的需求。但從實(shí)際落地和安全角度看,直接將自動(dòng)駕駛汽車的行駛?cè)拷唤oVLA,又有很多現(xiàn)實(shí)的難點(diǎn)和坑。



      邊緣場(chǎng)景或?qū)㈦y以理解

      大模型是靠大量數(shù)據(jù)學(xué)會(huì)“看”和“說”,但自動(dòng)駕駛強(qiáng)調(diào)的是不能能“看”,更要能做對(duì)事。交通環(huán)境中常見的場(chǎng)景很容易被模型學(xué)會(huì),但真正危險(xiǎn)的往往是那些如臨時(shí)擺放的異物、非常規(guī)施工標(biāo)識(shí)、突然沖出來的行人、凹陷或濕滑的路面、以及復(fù)雜的多車交互等不常見的極端情況。把這些長(zhǎng)尾場(chǎng)景都采集齊全幾乎不可能,尤其是要配套高質(zhì)量的動(dòng)作標(biāo)簽(也就是在那些場(chǎng)景下“應(yīng)該怎么做”)更是難上加難。

      對(duì)于邊緣場(chǎng)景,有些技術(shù)方案提出使用仿真幫忙補(bǔ)樣本,但仿真和真實(shí)世界總有差距。光照、材質(zhì)、行人行為建模都很難完全擬合現(xiàn)實(shí)。有時(shí)在仿真里“得分高”的策略,也可能利用了仿真里的漏洞,如果這些策略到了真車上反而會(huì)危險(xiǎn)。對(duì)于大模型學(xué)習(xí)還有一點(diǎn)不容忽視,用于訓(xùn)練控制的標(biāo)簽必須是物理可實(shí)現(xiàn)的。不是所有人為操作示例都適合直接當(dāng)作監(jiān)督信號(hào);一些看起來“聰明”的人為反應(yīng)其實(shí)依賴于人類的直覺和肉體補(bǔ)償(比如猛打方向時(shí)人的身體補(bǔ)償),模型直接模仿這些反而可能超出車輛動(dòng)力學(xué)極限。

      因此單靠堆數(shù)據(jù)和堆算力,無法把所有可能的危險(xiǎn)都消滅掉。更可行的做法是把VLA用來補(bǔ)強(qiáng)語義理解和異常檢測(cè),而不是把完全的控制權(quán)一次性托付給它。把它當(dāng)成能給出“高層建議”的大腦,而由經(jīng)過驗(yàn)證的低級(jí)控制器來做最終執(zhí)行,會(huì)安全得多。

      能想出來不等于能做得到

      語言模型擅長(zhǎng)推理和生成,但車輛有明確的物理約束。一個(gè)優(yōu)秀的駕駛“想法”可能需要的轉(zhuǎn)向角、加速度或車體傾斜等要求,有些在現(xiàn)實(shí)中可能根本實(shí)現(xiàn)不了。若不把這些物理約束強(qiáng)行嵌入到輸出環(huán)節(jié),模型又有可能提出不可行或危險(xiǎn)的軌跡。對(duì)于這類問題,要么在模型輸出端加上物理約束或后驗(yàn)校正,要么把動(dòng)作空間離散化讓模型只選“有限個(gè)可行動(dòng)作”。前者可以保持流暢性但增加工程復(fù)雜度,后者雖然簡(jiǎn)單但犧牲了自然和效率。



      還有就是時(shí)序問題。自動(dòng)駕駛的控制回路有嚴(yán)格的頻率和延遲要求。若模型在算力受限的車端運(yùn)行太慢,或者把重要推理放在云端遇到網(wǎng)絡(luò)波動(dòng),決策就會(huì)基于舊畫面來執(zhí)行,這反而會(huì)帶來駕駛風(fēng)險(xiǎn)。那種“決策滯后于現(xiàn)實(shí)”的情況,比決策錯(cuò)誤還危險(xiǎn)。很多常見的解決思路是“快思維+慢思維”架構(gòu),小而穩(wěn)定的模型在車端做基礎(chǔ)感知和閉環(huán)控制,復(fù)雜的語義推理和策略優(yōu)化放在后臺(tái)或云端,只在非關(guān)鍵時(shí)刻下提供建議。但這要求架構(gòu)設(shè)計(jì)非常嚴(yán)謹(jǐn),必須保證背景推理的結(jié)論不會(huì)在關(guān)鍵時(shí)刻破壞即時(shí)控制路徑。

      訓(xùn)練端到端系統(tǒng)常用的方法之一是強(qiáng)化學(xué)習(xí)或帶有獎(jiǎng)勵(lì)的優(yōu)化。若獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)不當(dāng),模型可能學(xué)到在訓(xùn)練或仿真中高分但現(xiàn)實(shí)里危險(xiǎn)的策略。比如會(huì)利用某些規(guī)則漏洞快速完成任務(wù),或者在仿真里靠冒險(xiǎn)動(dòng)作取勝。解決這類問題需要把安全約束顯式納入訓(xùn)練目標(biāo),或采用混合監(jiān)督(讓模型既學(xué)專家示范也學(xué)安全約束),還要在訓(xùn)練里引入更多對(duì)抗和擾動(dòng)場(chǎng)景。但這些措施會(huì)顯著抬高訓(xùn)練成本和驗(yàn)證復(fù)雜度。

      其實(shí)對(duì)于模型來說,算力和成本也是需要直面的問題,更大的模型意味著更貴、更耗電、更熱、需要更強(qiáng)的散熱設(shè)計(jì),這直接影響整車成本和可靠性。這就要求廠商采用“既省錢又靠譜”的折中方案,而不是盲目堆模型參數(shù)。

      黑箱很難過審,責(zé)任也難界定

      傳統(tǒng)自動(dòng)駕駛系統(tǒng)將感知、預(yù)測(cè)、規(guī)劃、控制等各模塊分得非常清晰,各模塊可以單獨(dú)驗(yàn)收、打樁測(cè)試、形式化驗(yàn)證。端到端的VLA可以把這些環(huán)節(jié)耦合在一起,提升效率,但出問題時(shí)也很難追根溯源。監(jiān)管機(jī)構(gòu)、保險(xiǎn)公司和法律體系更信任可審計(jì)、可重放、可證明的決策路徑。一個(gè)不能解釋為何在某一時(shí)刻緊急轉(zhuǎn)向或未能剎停的黑箱模型,在面對(duì)事故調(diào)查和責(zé)任認(rèn)定會(huì)極為不利。

      這就要求必須設(shè)計(jì)日志機(jī)制、關(guān)鍵中間態(tài)保存和可回溯的決策證據(jù)。把VLA用于生成解釋性文本(例如“由于前方有臨時(shí)施工牌,我建議減速”)是一條可行路徑,但這種解釋必須真實(shí)可驗(yàn)證,不能只是后置拼湊的“借口”。此外,形式化安全約束和保證性測(cè)試在端到端系統(tǒng)里更難做,需要新的驗(yàn)證方法論和更多的試驗(yàn)數(shù)據(jù),短期內(nèi)法規(guī)適配也是一道門檻。

      視覺好用但不會(huì)在所有場(chǎng)景都看清

      VLA的名字里有個(gè)“V”(視覺),這意味著相機(jī)會(huì)是主傳感器。相機(jī)能提供豐富的語義信息,但在弱光、逆光、霧霾、雨雪或被遮擋時(shí),它的表現(xiàn)會(huì)明顯下降。雷達(dá)和激光雷達(dá)在測(cè)距和穿透性上有優(yōu)勢(shì),但它們給出的信息不是“語義友好”的,對(duì)于“這是誰/這塊牌子意味著什么”的解釋不如視覺直觀。把視覺的語義理解和雷達(dá)/激光雷達(dá)的物理量整合起來,是一件技術(shù)上復(fù)雜但很有必要的事。



      此外,同樣的視覺目標(biāo)在不同城市或國(guó)家外觀可能差別很大,標(biāo)準(zhǔn)交通標(biāo)識(shí)、路面材質(zhì)、車輛樣式都不同。模型的跨域遷移需要大量本地化數(shù)據(jù)和細(xì)致的微調(diào),不然在新環(huán)境中容易出問題,就像特斯拉FSD在國(guó)內(nèi)使用初期,其表現(xiàn)也并不是很好。簡(jiǎn)而言之,要讓大模型做到“放車就能跑遍全世界”,現(xiàn)階段還不現(xiàn)實(shí)。

      如何安全地把控制權(quán)還給人?

      VLA最大的優(yōu)勢(shì)之一是能用自然語言和人互動(dòng),這對(duì)用戶體驗(yàn)很重要。但自然語言含糊和歧義性極高。用戶可能給出矛盾或不完整的指令,系統(tǒng)必須在理解意圖與遵守安全約束之間平衡。還有一個(gè)更現(xiàn)實(shí)的情況是,系統(tǒng)在遇到邊緣場(chǎng)景時(shí),如何安全地把控制權(quán)還給人?人被動(dòng)從乘客身份到主動(dòng)接管需要時(shí)間和注意力切換,如果這個(gè)過程設(shè)計(jì)不當(dāng),就會(huì)增加風(fēng)險(xiǎn)。因此,需要明確接管觸發(fā)條件、足夠的時(shí)間窗和清晰的提示方式,同時(shí)在設(shè)計(jì)上盡量減少對(duì)用戶即時(shí)高復(fù)雜度決策的依賴。

      對(duì)于消費(fèi)者來說,對(duì)自動(dòng)駕駛汽車的信任也非常關(guān)鍵。一次危險(xiǎn)的動(dòng)作就可能毀掉用戶對(duì)系統(tǒng)的信心。要建立信任,系統(tǒng)需要持續(xù)可靠且能解釋自己的行為。VLA在解釋性輸出方面有天然優(yōu)勢(shì),但前提是解釋必須準(zhǔn)確、可驗(yàn)證,并且易于理解。

      可落地的折中策略

      鑒于VLA模型不可不去面對(duì)的這些挑戰(zhàn),現(xiàn)階段最務(wù)實(shí)的做法是漸進(jìn)式、混合式落地。把VLA用在語義理解、異常檢測(cè)、場(chǎng)景注釋、人機(jī)交互等對(duì)實(shí)時(shí)性不那么敏感但對(duì)語義能力要求高的功能上,讓它成為“智能的助手”;對(duì)于關(guān)鍵的高頻控制仍然交給經(jīng)過驗(yàn)證的低級(jí)控制器。還有一種思路就是把VLA當(dāng)作慢思維:在后臺(tái)做長(zhǎng)時(shí)間的策略優(yōu)化、駕駛風(fēng)格學(xué)習(xí)和復(fù)雜場(chǎng)景分析,再把受限的結(jié)論以可解釋且受約束的方式下發(fā)給車端控制系統(tǒng)。

      對(duì)于商用化的模型,還必須設(shè)計(jì)好回退機(jī)制、日志與可審計(jì)模塊,并把它們寫進(jìn)每一次版本的驗(yàn)收標(biāo)準(zhǔn)。數(shù)據(jù)采集策略要優(yōu)先覆蓋那些影響安全的長(zhǎng)尾場(chǎng)景,仿真和現(xiàn)實(shí)測(cè)試要結(jié)合進(jìn)行,驗(yàn)證體系要能給出可量化的安全證據(jù)而不是單純的性能曲線。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      78歲老奶被送養(yǎng)老院,她笑著整理東西,5天后兒子接電話愣了

      78歲老奶被送養(yǎng)老院,她笑著整理東西,5天后兒子接電話愣了

      蘭姐說故事
      2025-08-06 17:00:09
      1970年,謝富治阻撓少將升官,主席掐滅煙頭問了一句,全場(chǎng)沒人敢接茬

      1970年,謝富治阻撓少將升官,主席掐滅煙頭問了一句,全場(chǎng)沒人敢接茬

      史海殘?jiān)?/span>
      2025-12-11 16:19:09
      總司令沒“兵權(quán)”?建國(guó)后朱老總為何從不主持軍委工作?這原因太真實(shí)了

      總司令沒“兵權(quán)”?建國(guó)后朱老總為何從不主持軍委工作?這原因太真實(shí)了

      史海孤雁
      2025-12-11 15:56:04
      祁同偉吞彈前一刻,沙瑞金接到京都99道命令后慌了:讓他進(jìn)省委!

      祁同偉吞彈前一刻,沙瑞金接到京都99道命令后慌了:讓他進(jìn)省委!

      瑾瑜聊情感
      2025-10-24 08:57:50
      中國(guó)高校第一城,大學(xué)生逼近170萬人

      中國(guó)高校第一城,大學(xué)生逼近170萬人

      21世紀(jì)經(jīng)濟(jì)報(bào)道
      2025-12-11 20:37:18
      美軍丟人丟大發(fā)了!剛從南海撈出戰(zhàn)機(jī)卻遭全網(wǎng)嘲諷,理由出奇一致

      美軍丟人丟大發(fā)了!剛從南海撈出戰(zhàn)機(jī)卻遭全網(wǎng)嘲諷,理由出奇一致

      云上烏托邦
      2025-12-11 00:20:04
      柬埔寨為什么不使用中國(guó)戰(zhàn)斗機(jī)去應(yīng)戰(zhàn)泰國(guó)的美制戰(zhàn)斗機(jī)?不自信?

      柬埔寨為什么不使用中國(guó)戰(zhàn)斗機(jī)去應(yīng)戰(zhàn)泰國(guó)的美制戰(zhàn)斗機(jī)?不自信?

      我心縱橫天地間
      2025-12-11 23:39:31
      連續(xù)2周超越蘋果,華為手機(jī)重奪國(guó)內(nèi)市場(chǎng)份額第一!

      連續(xù)2周超越蘋果,華為手機(jī)重奪國(guó)內(nèi)市場(chǎng)份額第一!

      每日經(jīng)濟(jì)新聞
      2025-12-11 14:38:24
      楊子直播曝猛料,即將和黃圣依復(fù)合,除了我,她看不上別的男人!

      楊子直播曝猛料,即將和黃圣依復(fù)合,除了我,她看不上別的男人!

      心靜物娛
      2025-12-12 14:18:14
      美國(guó)人的疑問:本拉登對(duì)多國(guó)發(fā)起襲擊,為何唯獨(dú)放過中國(guó)?

      美國(guó)人的疑問:本拉登對(duì)多國(guó)發(fā)起襲擊,為何唯獨(dú)放過中國(guó)?

      珺瑤婉史
      2025-11-19 19:20:06
      無妻無子,身價(jià)過億,年過50的老好人何炅,迎來自己“人生結(jié)局”

      無妻無子,身價(jià)過億,年過50的老好人何炅,迎來自己“人生結(jié)局”

      小莜讀史
      2025-12-11 15:08:14
      不是,英國(guó)怎么就成了比亞迪海外最大市場(chǎng)?

      不是,英國(guó)怎么就成了比亞迪海外最大市場(chǎng)?

      差評(píng)XPIN
      2025-12-11 00:08:02
      訂1600元一晚的別墅套餐,還沒住進(jìn)去,妻子摔骨折了

      訂1600元一晚的別墅套餐,還沒住進(jìn)去,妻子摔骨折了

      瀟湘晨報(bào)
      2025-12-11 19:47:43
      性與命和壽的關(guān)系:好命長(zhǎng)壽的男人,往往身上有這幾種特征

      性與命和壽的關(guān)系:好命長(zhǎng)壽的男人,往往身上有這幾種特征

      鬼菜生活
      2025-12-11 03:56:01
      快船113-115火箭!無奈的不是輸球,是哈登身邊已經(jīng)發(fā)生兩大變化

      快船113-115火箭!無奈的不是輸球,是哈登身邊已經(jīng)發(fā)生兩大變化

      魚崖大話籃球
      2025-12-12 17:13:15
      丈夫負(fù)債30萬,妻子有45萬存款卻無動(dòng)于衷,妻子坦言:想陪他吃苦

      丈夫負(fù)債30萬,妻子有45萬存款卻無動(dòng)于衷,妻子坦言:想陪他吃苦

      烙任情感
      2025-12-11 17:10:53
      郭德綱被約談6天后,曲協(xié)18字表態(tài),難怪郭麒麟多次拒絕接班!

      郭德綱被約談6天后,曲協(xié)18字表態(tài),難怪郭麒麟多次拒絕接班!

      烏娛子醬
      2025-12-11 16:19:14
      賭贏賺翻了:1/10價(jià)格買下價(jià)值56萬服務(wù)器主機(jī)!960GB內(nèi)存就已回本

      賭贏賺翻了:1/10價(jià)格買下價(jià)值56萬服務(wù)器主機(jī)!960GB內(nèi)存就已回本

      快科技
      2025-12-12 15:06:06
      外交部:中央政府堅(jiān)定支持香港特區(qū)依法懲治危害國(guó)家安全的犯罪行為

      外交部:中央政府堅(jiān)定支持香港特區(qū)依法懲治危害國(guó)家安全的犯罪行為

      新快報(bào)新聞
      2025-12-12 17:31:06
      量化交易在交易所的設(shè)備傳將被清退,大跌后一字漲停,散戶又吃苦

      量化交易在交易所的設(shè)備傳將被清退,大跌后一字漲停,散戶又吃苦

      你食不食油餅
      2025-12-12 01:39:12
      2025-12-12 18:51:00
      智駕最前沿
      智駕最前沿
      自動(dòng)駕駛領(lǐng)域?qū)I(yè)的技術(shù)、資訊分享平臺(tái)。我們的slogan是:聚焦智能駕駛 ,緊盯行業(yè)前沿。
      292文章數(shù) 11關(guān)注度
      往期回顧 全部

      科技要聞

      凌晨突發(fā)!GPT-5.2上線,首批實(shí)測(cè)感受來了

      頭條要聞

      沈逸:美國(guó)用最強(qiáng)硬的方式 吹響戰(zhàn)略撤退號(hào)角

      頭條要聞

      沈逸:美國(guó)用最強(qiáng)硬的方式 吹響戰(zhàn)略撤退號(hào)角

      體育要聞

      15輪2分,他們?cè)趺闯闪擞⒊顮€球隊(duì)?

      娛樂要聞

      上海這一夜,33歲陳麗君秒了32歲吉娜?

      財(cái)經(jīng)要聞

      鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

      汽車要聞

      插混四驅(qū)法拉利?849 Testarossa國(guó)內(nèi)發(fā)布516.8萬起

      態(tài)度原創(chuàng)

      健康
      本地
      游戲
      公開課
      軍事航空

      甲狀腺結(jié)節(jié)到這個(gè)程度,該穿刺了!

      本地新聞

      云游安徽|阜陽三朝風(fēng)骨,傳承千年墨香

      新一期Fami通銷量榜:新作《八方旅人0》上榜

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      澤連斯基:烏領(lǐng)土問題應(yīng)由烏人民決定

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 91视频免费看| 亚洲老熟女@TubeumTV| 欧美 变态 另类 人妖| 武鸣县| 999zyz玖玖资源站永久| 亚洲人成色777777老人头| 婷婷综合五月| 日韩av无码精品一二三区| 亚洲成熟女人毛毛耸耸多| 开心婷婷五月激情综合社区| 色婷婷亚洲精品天天综合| 欧洲美熟女乱又伦免费视频| 国产成人8x视频网站入口| 黄浦区| 911国产精品| 中文字幕人成无码免费视频| 色吊丝永久免费| 偶偶福利影院| 韩国三级a视频在线观看 | 无码精品国产va在线观看dvd| JIZZ亚洲| 熟女中文字幕| 久久综合给合久久狠狠97色| 老熟妇仑乱一区二区视頻| 极品无码国模国产在线观看| 国产精品视频一区国模私拍| 日本成本人片免费网站| 久久做受www| 亚洲国产一区二区三区| 一区二区乱子伦在线播放| 色欲av狠狠躁天天躁无码中文| 尤物av在线| 中文日产幕无线码一区中文| 欲香欲色天天综合和网| canopen草棚类别9791怎么查| 乱中年女人伦av三区| 在线播放亚洲人成电影| 日韩中文字幕区一区有砖一区| 国产精品久久无码一区| 宝清县| 三级色网|