廣袤的海洋蘊(yùn)藏著無(wú)盡的奧秘與豐富的資源。然而,深海的高壓、黑暗、復(fù)雜洋流與通信隔絕,使其成為人類最難觸及的領(lǐng)域。自20世紀(jì)70年代起,一群特殊的“探險(xiǎn)家”—海洋機(jī)器人—開(kāi)始代替人類,潛入萬(wàn)米海淵,巡視無(wú)邊海面,逐步揭開(kāi)海洋的神秘面紗。
從掛著纜繩的遙控潛水器,到獨(dú)立行動(dòng)的自主水下航行器;從在水面巡航的無(wú)人艇,到具備多棲能力的跨域機(jī)器人,這些形態(tài)功能各異的海洋機(jī)器人,已成為海洋科學(xué)研究、資源勘探、工程檢測(cè)乃至國(guó)防安全不可或缺的力量。
在此關(guān)鍵變革期,頂級(jí)綜述期刊《Annual Review of Control, Robotics, and Autonomous Systems》發(fā)表了一項(xiàng)重磅綜述—數(shù)據(jù)驅(qū)動(dòng)智能時(shí)代下的海洋機(jī)器人控制》。論文由香港科技大學(xué)洪林博士、張福民教授,大連海事大學(xué)劉陸教授、彭周華教授共同撰寫,為我們系統(tǒng)性地梳理了當(dāng)下海洋機(jī)器人控制的技術(shù)脈絡(luò),構(gòu)建了一個(gè)兼具權(quán)威性與前瞻性,系統(tǒng)且全面的認(rèn)知圖譜。
![]()
一、海洋機(jī)器人大家族:各顯神通的“海洋探索者”
自20世紀(jì)70年代問(wèn)世以來(lái),海洋機(jī)器人已發(fā)展出一個(gè)龐大的“家族”,每個(gè)成員都身懷絕技,適配不同的海洋任務(wù)。
自主水下航行器(AUV)如同“深海偵察兵”,無(wú)需線纜連接即可獨(dú)立完成水下測(cè)繪、樣本采集;遙控潛水器(ROV)則是“遠(yuǎn)程操作工”,通過(guò)臍帶纜接收指令,精準(zhǔn)執(zhí)行水下焊接、文物打撈等復(fù)雜任務(wù);無(wú)人水面航行器(USV)扮演著“水面哨兵”的角色,在海面進(jìn)行巡邏監(jiān)測(cè)、數(shù)據(jù)中繼;而水下滑翔器(UG)則像“節(jié)能巡航者”,依靠浮力調(diào)節(jié)實(shí)現(xiàn)長(zhǎng)航程、長(zhǎng)時(shí)間的海洋環(huán)境觀測(cè)。
![]()
各類海洋機(jī)器人的配置及其在海洋環(huán)境中的實(shí)際應(yīng)用
除此之外,仿生水下機(jī)器人(BUR)模仿魚(yú)類游動(dòng)姿態(tài),能在復(fù)雜水域靈活穿梭;空-水跨域機(jī)器人(AUR)可實(shí)現(xiàn)空中飛行與水下潛行的無(wú)縫切換,完成跨介質(zhì)觀測(cè);水下機(jī)器人-機(jī)械臂系統(tǒng)(UVMS)則兼具移動(dòng)能力與操作精度,成為水下作業(yè)的“多面手”。隨著海洋任務(wù)日益復(fù)雜,單一機(jī)器人的局限性逐漸顯現(xiàn)——感知范圍有限、容錯(cuò)能力不足、作業(yè)效率受限,于是多機(jī)器人協(xié)同系統(tǒng)應(yīng)運(yùn)而生,如同“海洋艦隊(duì)”般,通過(guò)分工協(xié)作實(shí)現(xiàn)更廣覆蓋、更高效率的任務(wù)執(zhí)行。
論文指出,無(wú)論形態(tài)如何,控制系統(tǒng)都是海洋機(jī)器人的“小腦”,既要保障基本的運(yùn)動(dòng)功能,又要支撐復(fù)雜的自主決策。與陸地或空中機(jī)器人不同,海洋環(huán)境充滿挑戰(zhàn):洋流、波浪、風(fēng)的干擾無(wú)處不在,流體動(dòng)力的非線性特性難以捉摸,水下通信延遲高、帶寬有限。這就要求海洋機(jī)器人的控制系統(tǒng)不僅要精準(zhǔn)實(shí)現(xiàn)路徑跟隨、軌跡跟蹤等基礎(chǔ)功能,還要具備極強(qiáng)的穩(wěn)健性和適應(yīng)性,在未知干擾與模型不確定性面前依然能夠可靠運(yùn)行。
二、傳統(tǒng)控制的“瓶頸”:為何海洋機(jī)器人需要“智能升級(jí)”
長(zhǎng)期以來(lái),海洋機(jī)器人的控制主要依賴基于模型的傳統(tǒng)方法。工程師們通過(guò)建立機(jī)器人的動(dòng)力學(xué)方程,描述其運(yùn)動(dòng)規(guī)律與受力情況,再設(shè)計(jì)相應(yīng)的控制算法實(shí)現(xiàn)精準(zhǔn)調(diào)控。這種方法在結(jié)構(gòu)簡(jiǎn)單、環(huán)境穩(wěn)定的場(chǎng)景中表現(xiàn)出色,但其局限性在復(fù)雜海洋環(huán)境中日益凸顯。
首先是“非線性難題”。海洋機(jī)器人在水中運(yùn)動(dòng)時(shí),會(huì)受到流體阻力、升力、附加質(zhì)量等多種力的作用,這些力與機(jī)器人的運(yùn)動(dòng)狀態(tài)呈非線性關(guān)系。其次是“模型不確定性”。機(jī)器人的水動(dòng)力參數(shù)會(huì)隨航行姿態(tài)、速度變化,推進(jìn)器、鰭片等執(zhí)行機(jī)構(gòu)的特性也會(huì)受海洋環(huán)境腐蝕、磨損影響,導(dǎo)致預(yù)設(shè)模型與實(shí)際情況存在偏差。再者,海洋環(huán)境的“動(dòng)態(tài)干擾”難以預(yù)測(cè)—洋流的強(qiáng)度和方向時(shí)刻變化,波浪、風(fēng)的作用隨機(jī)且復(fù)雜,這些外部擾動(dòng)會(huì)嚴(yán)重影響控制精度,甚至導(dǎo)致系統(tǒng)失穩(wěn)。此外,海洋機(jī)器人還面臨“欠驅(qū)動(dòng)約束”(部分機(jī)器人無(wú)法實(shí)現(xiàn)所有自由度的獨(dú)立控制)、“輸入飽和”(執(zhí)行器存在性能極限)、“狀態(tài)不可測(cè)”(傳感器難以獲取全部運(yùn)動(dòng)狀態(tài))等問(wèn)題。在多機(jī)器人協(xié)同場(chǎng)景中,水下通信的低帶寬、高延遲、易丟包等特性,進(jìn)一步增加了協(xié)同控制的難度。傳統(tǒng)控制方法難以應(yīng)對(duì)這些復(fù)雜挑戰(zhàn),亟需一種全新的控制范式實(shí)現(xiàn)突破。
三、數(shù)據(jù)驅(qū)動(dòng):海洋機(jī)器人的“智能學(xué)習(xí)”之路
近年來(lái),機(jī)器學(xué)習(xí)的快速發(fā)展為海洋機(jī)器人控制帶來(lái)了破局之路—數(shù)據(jù)驅(qū)動(dòng)控制。這種方法無(wú)需依賴精確的數(shù)學(xué)模型,而是通過(guò)分析大量實(shí)驗(yàn)或仿真數(shù)據(jù),讓機(jī)器人自主學(xué)習(xí)環(huán)境特性與運(yùn)動(dòng)規(guī)律,從而實(shí)現(xiàn)自適應(yīng)、高魯棒性的控制。
論文將數(shù)據(jù)驅(qū)動(dòng)控制方法歸納為三大類:基于模型的數(shù)據(jù)驅(qū)動(dòng)方法、無(wú)模型數(shù)據(jù)驅(qū)動(dòng)方法,以及傳統(tǒng)方法與數(shù)據(jù)驅(qū)動(dòng)的混合方法。
基于模型的數(shù)據(jù)驅(qū)動(dòng)方法,核心是“用數(shù)據(jù)學(xué)習(xí)模型”。通過(guò)神經(jīng)網(wǎng)絡(luò)、高斯過(guò)程、Koopman算子等技術(shù),從數(shù)據(jù)中挖掘機(jī)器人的動(dòng)態(tài)特性,構(gòu)建近似模型用于控制器設(shè)計(jì)。例如,神經(jīng)網(wǎng)絡(luò)如同“仿生大腦”,能通過(guò)多層神經(jīng)元的協(xié)同運(yùn)算,精準(zhǔn)擬合復(fù)雜的非線性動(dòng)力學(xué);高斯過(guò)程不僅能學(xué)習(xí)模型,還能量化預(yù)測(cè)的不確定性,為穩(wěn)健控制提供依據(jù);Koopman算子則能將非線性系統(tǒng)“轉(zhuǎn)化”為線性系統(tǒng)進(jìn)行分析,架起傳統(tǒng)線性控制與復(fù)雜非線性系統(tǒng)之間的橋梁。物理信息神經(jīng)網(wǎng)絡(luò)(PINN)更是將物理定律融入學(xué)習(xí)過(guò)程,確保模型既符合數(shù)據(jù)規(guī)律,又不違背基本物理原理,在數(shù)據(jù)稀疏的海洋場(chǎng)景中表現(xiàn)尤為出色。
![]()
海洋機(jī)器人數(shù)據(jù)驅(qū)動(dòng)控制方案
無(wú)模型數(shù)據(jù)驅(qū)動(dòng)方法則更進(jìn)一步,無(wú)需構(gòu)建任何模型,直接從數(shù)據(jù)中學(xué)習(xí)控制策略。其中,深度強(qiáng)化學(xué)習(xí)(DRL)是最具代表性的技術(shù)。這種方法讓機(jī)器人通過(guò)試錯(cuò)積累經(jīng)驗(yàn):完成任務(wù)獲得“獎(jiǎng)勵(lì)”,執(zhí)行錯(cuò)誤受到“懲罰”,通過(guò)不斷優(yōu)化策略最大化累積獎(jiǎng)勵(lì)。深度強(qiáng)化學(xué)習(xí)可分為基于價(jià)值、基于策略和演員-評(píng)論家三類方法。基于價(jià)值的方法如深度Q網(wǎng)絡(luò)(DQN),通過(guò)學(xué)習(xí)動(dòng)作的價(jià)值選擇最優(yōu)行為;基于策略的方法如近端策略優(yōu)化(PPO),直接優(yōu)化控制策略;演員-評(píng)論家方法則結(jié)合兩者優(yōu)勢(shì),學(xué)習(xí)效率更高、穩(wěn)定性更強(qiáng)。
模仿學(xué)習(xí)則為機(jī)器人提供了“捷徑”—直接學(xué)習(xí)專家的操作經(jīng)驗(yàn)。通過(guò)行為克隆、逆向強(qiáng)化學(xué)習(xí)、生成對(duì)抗模仿學(xué)習(xí)等技術(shù),機(jī)器人無(wú)需從零開(kāi)始試錯(cuò),而是快速?gòu)?fù)制人類或先進(jìn)算法的控制策略,大幅縮短學(xué)習(xí)周期。深度模仿強(qiáng)化學(xué)習(xí)更是融合了模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì),先通過(guò)專家演示快速初始化策略,再通過(guò)與環(huán)境交互持續(xù)優(yōu)化,兼顧了學(xué)習(xí)效率與控制性能。
混合控制方法則巧妙結(jié)合了傳統(tǒng)控制與數(shù)據(jù)驅(qū)動(dòng)的優(yōu)勢(shì)。例如,將比例-積分-微分(PID)控制的穩(wěn)定性與強(qiáng)化學(xué)習(xí)的自適應(yīng)性相結(jié)合,讓強(qiáng)化學(xué)習(xí)在線調(diào)節(jié)PID參數(shù),應(yīng)對(duì)環(huán)境變化;將模型預(yù)測(cè)控制(MPC)的約束處理能力與強(qiáng)化學(xué)習(xí)的優(yōu)化能力融合,提升復(fù)雜任務(wù)下的控制精度;將滑模控制(SMC)的魯棒性與強(qiáng)化學(xué)習(xí)的自適應(yīng)能力結(jié)合,增強(qiáng)系統(tǒng)抗干擾能力。這種“取長(zhǎng)補(bǔ)短”的設(shè)計(jì),成為當(dāng)前海洋機(jī)器人控制的熱門方向。
四、團(tuán)隊(duì)作戰(zhàn):多機(jī)器人協(xié)同的智能協(xié)作藝術(shù)
單一機(jī)器人的能力有限,多機(jī)器人協(xié)同作戰(zhàn)才能攻克更復(fù)雜的海洋任務(wù)。就像自然界中的魚(yú)群、鳥(niǎo)群,多臺(tái)海洋機(jī)器人通過(guò)協(xié)同控制,能實(shí)現(xiàn)空間覆蓋更廣、抗干擾能力更強(qiáng)、作業(yè)效率更高的團(tuán)隊(duì)優(yōu)勢(shì),完成單體機(jī)器人難以勝任的任務(wù),如大范圍流場(chǎng)測(cè)繪、水下協(xié)同操作、跨域搜救等。
多機(jī)器人協(xié)同控制主要分為三類場(chǎng)景:協(xié)同編隊(duì)、基于博弈的競(jìng)爭(zhēng)、跨域協(xié)作。協(xié)同編隊(duì)要求機(jī)器人保持預(yù)設(shè)的幾何構(gòu)型,如同“整齊的艦隊(duì)”執(zhí)行巡邏、監(jiān)測(cè)任務(wù);集群控制則模仿生物群體的自組織行為,機(jī)器人通過(guò)局部交互實(shí)現(xiàn)全局協(xié)調(diào),像“魚(yú)群”一樣靈活避障、自適應(yīng)調(diào)整;目標(biāo)包圍控制讓機(jī)器人圍繞目標(biāo)形成穩(wěn)定編隊(duì),實(shí)現(xiàn)對(duì)移動(dòng)目標(biāo)的跟蹤、攔截;區(qū)域覆蓋控制則通過(guò)合理規(guī)劃路徑,讓機(jī)器人高效掃描指定區(qū)域,完成環(huán)境監(jiān)測(cè)、搜救等任務(wù)。
![]()
多海洋機(jī)器人協(xié)作的典型任務(wù)場(chǎng)景
在競(jìng)爭(zhēng)場(chǎng)景中,博弈論成為核心工具。追擊-規(guī)避博弈模擬海上攔截、反潛作戰(zhàn)等任務(wù),追擊方協(xié)同規(guī)劃路徑捕獲目標(biāo),規(guī)避方則靈活機(jī)動(dòng)逃脫;圍困博弈中,多臺(tái)機(jī)器人協(xié)同包圍目標(biāo),限制其活動(dòng)范圍;三方博弈則涉及攻擊方、防御方與高價(jià)值目標(biāo),各方追求不同目標(biāo),形成復(fù)雜的對(duì)抗關(guān)系。
跨域協(xié)作則打破了單一領(lǐng)域的限制,讓水下、水面、空中機(jī)器人協(xié)同作業(yè)。例如,無(wú)人機(jī)負(fù)責(zé)空中偵察、中繼通信,無(wú)人水面艇負(fù)責(zé)海面部署、數(shù)據(jù)傳輸,自主水下航行器負(fù)責(zé)水下探測(cè)、樣本采集,通過(guò)多域協(xié)同實(shí)現(xiàn)“空地一體、水陸聯(lián)動(dòng)”的全方位海洋探索。
數(shù)據(jù)驅(qū)動(dòng)技術(shù)為多機(jī)器人協(xié)同提供了強(qiáng)大支撐。多智能體強(qiáng)化學(xué)習(xí)(MARL)讓機(jī)器人在動(dòng)態(tài)環(huán)境中學(xué)習(xí)合作與競(jìng)爭(zhēng)策略,深度多智能體強(qiáng)化學(xué)習(xí)(DMARL)則能從原始感官數(shù)據(jù)中實(shí)現(xiàn)端到端的協(xié)同控制。針對(duì)水下通信受限的問(wèn)題,研究者們開(kāi)發(fā)了分布式控制架構(gòu)、事件觸發(fā)通信、量化控制等技術(shù),在降低通信開(kāi)銷的同時(shí)保障協(xié)同性能;面對(duì)網(wǎng)絡(luò)威脅,安全分層架構(gòu)、魯棒估計(jì)器等技術(shù)讓協(xié)同系統(tǒng)更具抗干擾能力。
五、技術(shù)開(kāi)源,讓海洋探索更普惠
海洋機(jī)器人研究曾受限于高昂的硬件成本和封閉的技術(shù)體系,而開(kāi)源平臺(tái)的出現(xiàn)正在改變這一現(xiàn)狀。開(kāi)源仿真平臺(tái)為研究者提供了安全、靈活、低成本的測(cè)試環(huán)境,無(wú)需實(shí)際部署即可驗(yàn)證控制算法。例如,HoloOcean支持多機(jī)器人協(xié)同仿真,集成了豐富的傳感器模型和真實(shí)的水下通信機(jī)制;UUV Simulator專注于水下機(jī)器人仿真,能精準(zhǔn)模擬流體動(dòng)力學(xué)效應(yīng);MarineGym則專為強(qiáng)化學(xué)習(xí)設(shè)計(jì),支持大規(guī)模并行仿真和仿真到現(xiàn)實(shí)的遷移。
開(kāi)源海洋機(jī)器人硬件進(jìn)一步降低了研究門檻。BlueROV2作為經(jīng)典的開(kāi)源遙控潛水器,采用模塊化設(shè)計(jì),支持傳感器和執(zhí)行器的靈活擴(kuò)展,成為全球研究者的首選平臺(tái);LoCO AUV、MeCO AUV等開(kāi)源自主水下航行器,兼顧低成本與高性能,適合教育和科研使用;開(kāi)源無(wú)人水面航行器如ARCAB、MicroUSV,為水面機(jī)器人研究提供了便捷工具;開(kāi)源仿生水下機(jī)器人OpenFish則為仿生機(jī)器人研究提供了可定制的硬件平臺(tái)。
開(kāi)源軟件框架如機(jī)器人操作系統(tǒng)(ROS),實(shí)現(xiàn)了仿真與實(shí)際機(jī)器人的無(wú)縫對(duì)接,促進(jìn)了算法的共享與復(fù)用。這些開(kāi)源資源打破了機(jī)構(gòu)間的技術(shù)壁壘,讓學(xué)生、研究者和小型機(jī)構(gòu)都能參與海洋機(jī)器人研發(fā),加速了技術(shù)創(chuàng)新與成果轉(zhuǎn)化。
六、未來(lái)展望:更智能、更自主的海洋探索者
數(shù)據(jù)驅(qū)動(dòng)技術(shù)正在重塑海洋機(jī)器人控制的范式,但挑戰(zhàn)依然存在:如何提升數(shù)據(jù)效率,減少機(jī)器人對(duì)海量數(shù)據(jù)的依賴;如何增強(qiáng)算法的可解釋性,確保控制決策的安全性;如何實(shí)現(xiàn)仿真到現(xiàn)實(shí)的高效遷移,降低實(shí)際部署成本;如何應(yīng)對(duì)復(fù)雜海洋環(huán)境中的通信約束和動(dòng)態(tài)干擾。這些挑戰(zhàn)也正是未來(lái)的研究方向。
未來(lái),海洋機(jī)器人將朝著更智能、更自主、更安全的方向發(fā)展。物理信息學(xué)習(xí)與離線強(qiáng)化學(xué)習(xí)的結(jié)合,將讓機(jī)器人在少量數(shù)據(jù)下快速學(xué)習(xí),且無(wú)需在線試錯(cuò)即可獲得可靠策略;大語(yǔ)言模型的融入,將實(shí)現(xiàn)人機(jī)自然語(yǔ)言交互,讓非專業(yè)人員也能操控海洋機(jī)器人;跨域協(xié)同技術(shù)的突破,將構(gòu)建“空-海-陸”一體化的海洋探索網(wǎng)絡(luò);安全強(qiáng)化學(xué)習(xí)的發(fā)展,將確保機(jī)器人在復(fù)雜環(huán)境中自主規(guī)避風(fēng)險(xiǎn),保障作業(yè)安全。
論文鏈接:https://doi.org/10.1146/annurev-control-022723-033729
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.