<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      SkyDreamer-端到端視覺無人機(jī)競(jìng)速的模型強(qiáng)化學(xué)習(xí)方法

      0
      分享至

      文章來源:鼓搗AI。


      一、研究動(dòng)機(jī) 現(xiàn)有方法的局限性

      盡管自主無人機(jī)競(jìng)速(ADR)已達(dá)到冠軍級(jí)水平,但存在三大核心問題:

      1. 1.高度專用化:依賴門角檢測(cè)、PnP算法、精確的相機(jī)標(biāo)定和手工調(diào)參的卡爾曼濾波器

      2. 2.泛化能力差:無法適應(yīng)未知賽道、不同無人機(jī)或非結(jié)構(gòu)化環(huán)境

      3. 3.端到端視覺方法的缺陷

      • ? 現(xiàn)有方法都需要外部輔助(如動(dòng)作捕捉系統(tǒng))

      • ?無法機(jī)載運(yùn)行

      • ?未達(dá)到冠軍級(jí)性能(加速度僅2-2.7g)

      關(guān)鍵挑戰(zhàn)

      挑戰(zhàn)

      視覺現(xiàn)實(shí)差距

      仿真圖像與真實(shí)圖像差異大

      視覺歧義

      相似場(chǎng)景需要不同飛行路徑

      可解釋性

      端到端黑盒模型難以調(diào)試

      相機(jī)標(biāo)定

      外參標(biāo)定耗時(shí)且易變化

      論文鏈接:https://arxiv.org/pdf/2510.14783v1.pdf



      • ? 頂部圖片:真實(shí)飛行場(chǎng)景,展示MAVLab門和飛行軌跡

      • ? 底部左圖:使用的競(jìng)速無人機(jī)(與A2RL x DCL 2025比賽相同)

      • ? 底部右圖:機(jī)載相機(jī)拍攝的圖像,紅色區(qū)域?yàn)镚ateNet生成的分割掩碼

      二、核心方法 2.1 整體架構(gòu):基于Informed Dreamer

      SkyDreamer的核心思想是將模型強(qiáng)化學(xué)習(xí)與特權(quán)信息(privileged information)巧妙結(jié)合。它基于DreamerV3的模型強(qiáng)化學(xué)習(xí)框架構(gòu)建,但做了關(guān)鍵擴(kuò)展:讓世界模型不僅預(yù)測(cè)未來,還要解碼出那些只在訓(xùn)練時(shí)可用的"特權(quán)信息"——包括精確的位置、速度、姿態(tài)角,以及相機(jī)外參和無人機(jī)動(dòng)力學(xué)參數(shù)。這個(gè)設(shè)計(jì)看似簡(jiǎn)單,卻帶來了革命性的變化:世界模型不再是一個(gè)純粹的黑盒預(yù)測(cè)器,而是變成了一個(gè)隱式的狀態(tài)和參數(shù)估計(jì)器

      觀察 → 編碼器 → 隱藏狀態(tài) → 解碼器 → 特權(quán)信息
      標(biāo)準(zhǔn)DreamerV3
      • ? 彩色方塊:編碼器輸入(觀察)

      • ? enc:編碼器

      • ? dec:解碼器

      • ? zt:離散潛在表示

      • ? ht:隱藏狀態(tài)

      • ? at:動(dòng)作

      • ? 紫色箭頭:序列模型的時(shí)序連接

      關(guān)鍵組件

      1. 1.世界模型(World Model)

      • ?編碼器: 將分割掩碼、IMU、電機(jī)轉(zhuǎn)速編碼為離散表示zt

      • ?序列模型: GRU預(yù)測(cè)下一隱藏狀態(tài)h_{t+1}

      • ?動(dòng)態(tài)預(yù)測(cè)器: 純粹從ht預(yù)測(cè)?t(用于想象rollout)

      • ?解碼器: 從(ht, zt)解碼出真實(shí)狀態(tài)和參數(shù)

      SkyDreamer世界模型學(xué)習(xí)
      • ? 齒輪+相機(jī)圖標(biāo):特權(quán)信息解碼輸出

      • ? dyn:動(dòng)態(tài)預(yù)測(cè)器

      1. 2.Actor-Critic

      • ? Actor直接輸出電機(jī)命令(非集體推力+姿態(tài)速率)

      • ? 添加平滑正則化防止bang-bang控制

      SkyDreamer Actor-Critic學(xué)習(xí)
      • ? 想象rollout:僅使用動(dòng)態(tài)預(yù)測(cè)器,無環(huán)境反饋

      2.3 關(guān)鍵技術(shù)創(chuàng)新 ① 飛行計(jì)劃向量(Flight Plan Vector)

      解決視覺歧義問題:

      f_i = [     p_g^i - p_g^{i-1},  # 相對(duì)位置差     ψ_g^i - ψ_g^{i-1},  # 相對(duì)偏航角     p_g^i, ψ_g^i,       # 絕對(duì)位置和偏航     ...,                 # 未來3個(gè)門的信息     p_g^{i+2}, ψ_g^{i+2} ]

      觸發(fā)條件:當(dāng)估計(jì)的門相對(duì)位置x?_g > -0.15m時(shí)更新門索引

      ② 視覺增強(qiáng)(Visual Augmentation)

      StochGAN + 數(shù)據(jù)增強(qiáng)

      1. 1.CycleGAN變體:將理想分割掩碼轉(zhuǎn)換為真實(shí)質(zhì)量掩碼

      2. 2.隨機(jī)腐蝕:50%概率腐蝕1像素模擬掩碼變薄

      3. 3.滾動(dòng)快門模擬

        A = [1,  -s·r_c,  W/2·s·r_c  ]     [0, 1+s·q_c, -H/2·s·q_c ]

        模擬水平剪切和垂直縮放

      ③ 相機(jī)內(nèi)參標(biāo)準(zhǔn)化 + 外參估計(jì)
      • ?內(nèi)參標(biāo)定:所有圖像映射到固定針孔模型

      • ?外參在線估計(jì):世界模型解碼相機(jī)俯仰角、橫滾角、偏航角

      核心公式

      K = [25W/64,    0,     0.5W ]     [   0,   25H/64,  0.5H ]     [   0,      0,      1   ]
      三、實(shí)驗(yàn)結(jié)果與分析 3.1 性能表現(xiàn) 仿真實(shí)驗(yàn)(梯子倒環(huán)賽道)

      指標(biāo)

      數(shù)值

      最高速度

      13 m/s

      最大加速度

      6 g

      飛行區(qū)域

      6×4 m

      位置估計(jì)誤差

      ±10-15 cm

      速度估計(jì)誤差

      ±0.5 m/s


      仿真梯子倒環(huán)賽道

      左圖(俯視圖)

      • ? 黑色線:ground truth軌跡

      • ? 彩色線:SkyDreamer估計(jì)的位置和速度

      • ? 顏色編碼:速度大小(紫色2m/s → 黃色12m/s)

      • ? 黑色方塊:門位置(厚度夸張顯示)

      • ? 黑色箭頭:相機(jī)主軸方向

      右圖(側(cè)視圖 + 3D渲染)

      • ? 彩色軌跡:ground truth位置和速度

      • ? 顏色條:速度刻度(0-12 m/s)

      真實(shí)世界實(shí)驗(yàn)

      賽道

      成功率

      平均圈速

      最高速度

      最大加速度

      倒環(huán)(橙色門)

      100% (25/25圈)

      3.25±0.22s

      13 m/s

      6 g

      梯子倒環(huán)

      100% (25/25圈)

      3.62±0.06s

      6 g

      倒環(huán)(MAVLab門)

      100% (25/25圈)

      2.97±0.08s

      大賽道

      83% (10/12圈)

      21 m/s

      6 g


      真實(shí)世界倒環(huán)賽道(橙色門)

      左側(cè)軌跡圖

      • ? 黑色線:MoCap ground truth

      • ? 彩色線:SkyDreamer估計(jì)

      • ? 顏色編碼:速度(紫色2m/s → 黃色12m/s)

      • ? 黑色方塊:門位置(厚度夸張)

      • ? 黑色箭頭:相機(jī)主軸方向

      右側(cè)合成圖

      • ? 多條疊加軌跡:5圈飛行的疊加

      • ? 展示軌跡在門中心的匯聚

      3.2 核心能力驗(yàn)證 ① 參數(shù)估計(jì)能力

      成功估計(jì)的參數(shù)

      • ? ? 最大電機(jī)轉(zhuǎn)速ω_max(收斂快,誤差小)

      • ? ? 推力系數(shù)k_w

      • ? ? 電機(jī)響應(yīng)時(shí)間τ

      • ? ? 相機(jī)外參θ_c, φ_c, ψ_c(±1°)

      難以估計(jì)的參數(shù)

      • ? ? 阻力系數(shù)k_x

      • ? ?? 單個(gè)螺旋槳響應(yīng)k_{p1}, k_{q1}(有漂移)

      ② 電池耗盡魯棒性

      實(shí)驗(yàn)場(chǎng)景:電池從滿電到30%放電

      • ? 最大轉(zhuǎn)速下降:3200 → 2200 rad/s(降低30%,超出訓(xùn)練范圍±20%)

      • ?結(jié)果:SkyDreamer實(shí)時(shí)檢測(cè)并調(diào)整飛行路徑,仍完成所有圈數(shù)

      ③ 視覺Sim-to-Real Transfer

      MAVLab門實(shí)驗(yàn)

      • ? 分割質(zhì)量差:門邊緣不完整、背景誤檢、形狀圓潤(rùn)

      • ?結(jié)果:仍100%完成25圈,證明對(duì)感知噪聲魯棒

      3.3 對(duì)比分析

      方法

      機(jī)載運(yùn)行

      Sim-to-Real

      冠軍級(jí)性能

      可解釋性

      Kaufmann等[1]

      ? (6g)

      Geles等[4]

      ? (2g)

      Xing等[5]

      ? (HIL)

      ? (2.7 TWR)

      Romero等[6]

      ? (HIL)

      ??

      Krinner等[7]

      ? (HIL)

      SkyDreamer

      ? (6g)


      四、技術(shù)細(xì)節(jié) 4.1 訓(xùn)練設(shè)置

      三階段訓(xùn)練(1700萬(wàn)步,約50小時(shí)):

      1. 1.預(yù)熱階段(0-800萬(wàn)步):默認(rèn)DreamerV3設(shè)置

      2. 2.長(zhǎng)序列階段(800-1300萬(wàn)步):batch length從64→256

      3. 3.精調(diào)階段(1300-1700萬(wàn)步):降低熵系數(shù)和學(xué)習(xí)率

      關(guān)鍵超參數(shù)

      γ = 0.997          # 折扣因子 λ_smooth = 0.002   # 平滑正則化系數(shù) control_freq = 90 Hz image_size = 64×64
      4.2 獎(jiǎng)勵(lì)函數(shù)

      r_t = 5·r_prog - r_rate + 30·r_gate r_prog = ||p_{t-1,g}||_2 - ||p_{t,g}||_2  # 進(jìn)度獎(jiǎng)勵(lì) r_rate = exp(min(||Ω_t||_1, 17))/2·f_c·10^5  # 角速度懲罰 r_gate = 1 - max(|y_g|, |z_g|)/d_g  # 穿門獎(jiǎng)勵(lì)(中心最大)

      無感知獎(jiǎng)勵(lì):相機(jī)自然朝向門(涌現(xiàn)行為)

      五、結(jié)論與啟示 主要貢獻(xiàn)

      1. 1.首個(gè)端到端視覺→電機(jī)命令的ADR策略

      2. 2.首次達(dá)到冠軍級(jí)性能(6g加速度,21 m/s速度)

      3. 3.首次實(shí)現(xiàn)全機(jī)載、無外部輔助的端到端視覺ADR

      4. 4. 通過解碼特權(quán)信息實(shí)現(xiàn)可解釋性

      5. 5. 無需外參標(biāo)定,可快速部署到不同無人機(jī)

      局限性
      1. 1. ?? 參數(shù)估計(jì)存在漂移

      2. 2. ?? 狀態(tài)估計(jì)有高頻跳變

      3. 3. ?? 對(duì)分割假陽(yáng)性仍敏感

      4. 4. ?? 訓(xùn)練成本高(50小時(shí))

      未來方向
      • ? 擴(kuò)展到深度圖等更通用視覺輸入

      • ? 飛行未見賽道

      • ? 泛化到非結(jié)構(gòu)化環(huán)境

      • ? 結(jié)合障礙物避讓的混合任務(wù)

      關(guān)鍵洞察
      "通過讓世界模型解碼特權(quán)信息,我們將黑盒端到端策略轉(zhuǎn)變?yōu)殡[式狀態(tài)和參數(shù)估計(jì)器,在保持端到端學(xué)習(xí)優(yōu)勢(shì)的同時(shí)獲得了可解釋性。"

      這項(xiàng)工作證明了模型強(qiáng)化學(xué)習(xí) + 特權(quán)信息解碼是實(shí)現(xiàn)高性能、可解釋、魯棒的端到端視覺機(jī)器人控制的有效范式。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      “最風(fēng)流”央視女主持:將2個(gè)有婦之夫玩弄于股掌,如今幸福嗎

      “最風(fēng)流”央視女主持:將2個(gè)有婦之夫玩弄于股掌,如今幸福嗎

      優(yōu)趣紀(jì)史記
      2025-11-29 17:22:29
      一口氣看完四集郭京飛新劇《老舅》,我感慨萬(wàn)千,寫下這篇文章

      一口氣看完四集郭京飛新劇《老舅》,我感慨萬(wàn)千,寫下這篇文章

      晴晴的娛樂日記
      2025-12-15 22:06:55
      何晴去世不到24小時(shí),惡心事發(fā)生!私生活被詬病,網(wǎng)友:紅顏薄命

      何晴去世不到24小時(shí),惡心事發(fā)生!私生活被詬病,網(wǎng)友:紅顏薄命

      徐徐道史
      2025-12-14 18:28:32
      廣西54歲李某甘蔗地殺2女后續(xù)!10萬(wàn)懸賞追逃,當(dāng)?shù)厝似馗鄡?nèi)幕

      廣西54歲李某甘蔗地殺2女后續(xù)!10萬(wàn)懸賞追逃,當(dāng)?shù)厝似馗鄡?nèi)幕

      奇思妙想草葉君
      2025-12-14 21:46:07
      醫(yī)生苦勸:長(zhǎng)期吃降壓藥的人,千萬(wàn)要牢記,多補(bǔ)充這3種維生素!

      醫(yī)生苦勸:長(zhǎng)期吃降壓藥的人,千萬(wàn)要牢記,多補(bǔ)充這3種維生素!

      紙上的心語(yǔ)
      2025-12-15 21:32:22
      中方一句“東倭”,嚇壞日本右翼?前駐華大使急呼:該臥薪嘗膽了

      中方一句“東倭”,嚇壞日本右翼?前駐華大使急呼:該臥薪嘗膽了

      近史博覽
      2025-12-15 14:43:10
      突發(fā)!澤連斯基,妥協(xié)了!一切結(jié)束了!

      突發(fā)!澤連斯基,妥協(xié)了!一切結(jié)束了!

      財(cái)經(jīng)要參
      2025-12-15 13:18:38
      人社部定調(diào)!穩(wěn)步提高社會(huì)保障待遇水平,2026年養(yǎng)老金雙增長(zhǎng)嗎?

      人社部定調(diào)!穩(wěn)步提高社會(huì)保障待遇水平,2026年養(yǎng)老金雙增長(zhǎng)嗎?

      財(cái)話連篇
      2025-12-15 18:35:49
      亞運(yùn)三金王王莉?qū)嵜e報(bào):基地主任索要15萬(wàn) 體罰辱罵下跪是常事

      亞運(yùn)三金王王莉?qū)嵜e報(bào):基地主任索要15萬(wàn) 體罰辱罵下跪是常事

      醉臥浮生
      2025-12-15 08:01:17
      錢再多有啥用?鞏俐帶77歲老公回北京,雪中騎一輛車,笑容藏不住

      錢再多有啥用?鞏俐帶77歲老公回北京,雪中騎一輛車,笑容藏不住

      洲洲影視娛評(píng)
      2025-12-13 19:57:10
      張藝興發(fā)文致歉:因參加國(guó)家話劇院重要活動(dòng)而趕回北京,此前SM娛樂臨時(shí)公告張藝興將缺席EXO粉絲見面會(huì),已入場(chǎng)觀演門票不可退款

      張藝興發(fā)文致歉:因參加國(guó)家話劇院重要活動(dòng)而趕回北京,此前SM娛樂臨時(shí)公告張藝興將缺席EXO粉絲見面會(huì),已入場(chǎng)觀演門票不可退款

      極目新聞
      2025-12-14 18:51:00
      張文宏直言:不管你信不信,老人過了80歲,基本都有如下7個(gè)現(xiàn)狀

      張文宏直言:不管你信不信,老人過了80歲,基本都有如下7個(gè)現(xiàn)狀

      黃河新流域
      2025-09-28 13:34:43
      被全網(wǎng)瘋傳的“雙頂流”戀愛瓜,竟是他倆?結(jié)果大反轉(zhuǎn)!

      被全網(wǎng)瘋傳的“雙頂流”戀愛瓜,竟是他倆?結(jié)果大反轉(zhuǎn)!

      毒舌八卦
      2025-12-15 22:52:12
      央視一哥畢福劍再婚生子,次子已上幼兒園,生活近況曝光

      央視一哥畢福劍再婚生子,次子已上幼兒園,生活近況曝光

      復(fù)轉(zhuǎn)這些年
      2025-12-07 15:39:25
      U23亞洲杯最終23人名單確定,6人無緣參賽或被淘汰

      U23亞洲杯最終23人名單確定,6人無緣參賽或被淘汰

      凡人說體育
      2025-12-15 13:55:06
      何晴離世消息曝光不到24小時(shí),惡心的一幕出現(xiàn)了!

      何晴離世消息曝光不到24小時(shí),惡心的一幕出現(xiàn)了!

      叨嘮
      2025-12-15 01:57:05
      撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動(dòng)戰(zhàn)爭(zhēng)

      撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動(dòng)戰(zhàn)爭(zhēng)

      泠泠說史
      2025-12-15 18:05:17
      西方內(nèi)訌升級(jí):英銀行家集體反水威脅撤出俄資產(chǎn)

      西方內(nèi)訌升級(jí):英銀行家集體反水威脅撤出俄資產(chǎn)

      夢(mèng)想的現(xiàn)實(shí)
      2025-12-15 10:41:52
      賺大陸錢捐給“臺(tái)獨(dú)”的集團(tuán):民進(jìn)黨的頭號(hào)金主,終于被殺雞儆猴

      賺大陸錢捐給“臺(tái)獨(dú)”的集團(tuán):民進(jìn)黨的頭號(hào)金主,終于被殺雞儆猴

      被誤解的時(shí)候能微微一笑
      2025-12-15 08:54:45
      變臉?亞歷山大賽前曾表示想追73勝紀(jì)錄,輸馬刺后稱破紀(jì)錄毫無意義

      變臉?亞歷山大賽前曾表示想追73勝紀(jì)錄,輸馬刺后稱破紀(jì)錄毫無意義

      懂球帝
      2025-12-15 15:24:06
      2025-12-16 06:44:49
      算法與數(shù)學(xué)之美 incentive-icons
      算法與數(shù)學(xué)之美
      分享知識(shí),交流思想
      5267文章數(shù) 64595關(guān)注度
      往期回顧 全部

      科技要聞

      大佬冷酷預(yù)言:未來15年 人形機(jī)器人成廢鐵

      頭條要聞

      小米車主第1天提車在交付中心撞人 小米內(nèi)部人士回應(yīng)

      頭條要聞

      小米車主第1天提車在交付中心撞人 小米內(nèi)部人士回應(yīng)

      體育要聞

      戰(zhàn)勝完全體雷霆,馬刺“瘋狂動(dòng)物城”只是半成品

      娛樂要聞

      何晴告別式現(xiàn)場(chǎng),前夫許亞軍雙眼泛紅?

      財(cái)經(jīng)要聞

      新農(nóng)合漲到400元 農(nóng)民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬(wàn)起

      態(tài)度原創(chuàng)

      教育
      房產(chǎn)
      本地
      親子
      公開課

      教育要聞

      12月13日雅思大作文示范寫作 | 探索未開發(fā)景點(diǎn)的利與弊

      房產(chǎn)要聞

      6.66億摘地,海南封關(guān)大動(dòng)作,千畝海澄新城震撼登場(chǎng)

      本地新聞

      云游安徽|阜陽(yáng)三朝風(fēng)骨,傳承千年墨香

      親子要聞

      寶寶為啥一出門就不鬧了?真相不是“看新鮮”,90%家長(zhǎng)沒琢磨透

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 激情综合色五月六月婷婷| 超碰91在线| 久久久精品国产sm调教网站| 天天躁狠狠躁av| 久久综合综合久久综合| 色色看片| 国产精品自在欧美一区| 成人网站免费观看| 平顶山市| 国产精品久久久久无码日韩| 亚洲国产成人极品综合| 中文字幕精品久久久久人妻红杏Ⅰ| av色天堂| 国产成人久久婷婷精品流白浆| 岛国无码AV| 色综合AV综合无码综合网站| 久久亚洲春色中文字幕久久久| 国产激情免费视频在线观看| 国产XXXX| 国产精品久久久久久久专区| 巨人精品福利官方导航| 操B小视频| av无码免费| 操逼不卡| 国产精品美女久久久久久久久| 隔壁人妻偷人bd中字| 国产精品亚韩精品无码a在线| 欧亚aV| 久久精品国产热久久精品国产亚洲| 天天躁狠狠躁av| 色五月人妻| 丝袜shi在线播放| 午夜免费福利小电影| 亚洲AV日韩AV永久无码网站| 久艹av| 最新亚洲人成网站在线观看 | 无码福利一区二区三区| 色偷偷免费视频| 丝袜美腿视频一区二区三区 | 国产亚洲精品第一综合麻豆| 免费av网站|