二十年前,日本本田的阿西莫機器人能跑能跳、端茶遞水,讓全世界都以為“機器人的未來屬于日本”。
![]()
可現(xiàn)在呢?中國和美國已經(jīng)把日本遠(yuǎn)遠(yuǎn)甩在身后,尤其是中國,在機器人領(lǐng)域成了絕對的領(lǐng)跑者。
有人說這是因為中國供應(yīng)鏈牛,機器人配件又快又好又便宜。確實,以前日本一臺阿西莫賣250萬美元,現(xiàn)在中國同類機器人十幾萬就能拿下,性能還更強。但供應(yīng)鏈再好,也解釋不了價格差了上百倍啊!
真正的“殺手锏”是神經(jīng)網(wǎng)絡(luò)!它的出現(xiàn)讓機器人成本暴跌,直接把日本幾十年的技術(shù)積累給顛覆了。
![]()
傳統(tǒng)機器人:精致的“繡花枕頭”
假設(shè)你是程序員,要給機器人設(shè)計“大腦”,你會咋做?
大多數(shù)人會在電腦里給機器人建模:關(guān)節(jié)多長多重、電機多大力……比如讓機器人抓手機,就得計算手的運動軌跡,控制電機張合,還要根據(jù)手機重量和摩擦系數(shù)算電機的力,甚至得算整個系統(tǒng)的重量來讓電機穩(wěn)定托舉。
這就是日本當(dāng)年用的MPC(模型預(yù)測控制),靠物理模型來控制機器人。簡單說,就是在電腦里建個虛擬物理世界,把現(xiàn)實里的加速度、摩擦力這些物理法則都塞進(jìn)去,讓電腦自己算每個電機該出多大力。

思路是挺對,但問題大了去了,現(xiàn)實和模擬差太多了!
一方面,現(xiàn)實世界太復(fù)雜,根本沒法完美建模到電腦里;另一方面,機器人的執(zhí)行器也不可能完美執(zhí)行電腦的命令。
打個比方,電腦里設(shè)定了地板和機器人的摩擦力,但你打個噴嚏,飛沫落到地上,摩擦力就變了;瓷磚地面的微小紋理變化,也能讓機器人打滑摔倒。更別說還有風(fēng)、電機卡毛、工人忘拖地、螺絲沒打緊這些變量了,機器人能不出問題嗎?
而且機器人的硬件也不可能絕對精密,減速器齒輪的微小曠量會讓機器人抖動,編碼器的一點點誤差,可能讓機器人因為0.1毫米的偏差就大幅晃動甚至摔倒。
所以日本當(dāng)年造的機器人,更像個超精密儀器,得花大價錢打造,一臺賣250萬美元。這么貴,高校和科研機構(gòu)根本用不起,最新技術(shù)沒法在它身上應(yīng)用,自然就慢慢落伍了,既燒錢又沒法商業(yè)化,日本的機器人時代就這么涼了。
![]()
神經(jīng)網(wǎng)絡(luò):機器人的“野路子學(xué)霸”
到了2010年代,神經(jīng)網(wǎng)絡(luò)(尤其是強化學(xué)習(xí))橫空出世,徹底改變了游戲規(guī)則。
強化學(xué)習(xí)是啥?它基于一個巨大的行為矩陣,電腦可以在里面隨機選擇驅(qū)動機器人關(guān)節(jié)的方式。一開始可能是“亂扭”,但通過獎勵-懲罰機制,它會慢慢“學(xué)”會正確的動作,比如往前走就獎勵,沒往前走就懲罰,練著練著就會走路了。
這過程看著簡單,效果卻秒殺傳統(tǒng)的MPC方法。核心原因是它能暴力解決“模擬-現(xiàn)實落差”。
現(xiàn)實中影響機器人的因素太多了,工程師根本列不完。傳統(tǒng)算法應(yīng)對不確定因素的能力(魯棒性)很差,而神經(jīng)網(wǎng)絡(luò)靠參數(shù)隨機化就能解決。
![]()
什么是參數(shù)隨機化?就是人為給神經(jīng)網(wǎng)絡(luò)加“麻煩”。比如機器人在模擬環(huán)境里跑穩(wěn)了,就給它加隨機的風(fēng),讓它被吹得東倒西歪,逼著它學(xué)怎么在有風(fēng)的時候保持平衡。這個過程不需要工程師去算流體力學(xué),神經(jīng)網(wǎng)絡(luò)會像人試錯一樣,靠經(jīng)驗學(xué)出一個包含數(shù)百萬甚至上千萬參數(shù)的矩陣,從而應(yīng)對各種情況。
這就像小朋友學(xué)用筷子,不會去算杠桿原理、摩擦系數(shù),就是一遍遍試,最后就會了。神經(jīng)網(wǎng)絡(luò)控制機器人也是這樣,不需要復(fù)雜的物理模型,全靠經(jīng)驗和“直覺”。哪怕機器人硬件減配、滿身瑕疵,把這些“爛攤子”丟給它,它也能通過訓(xùn)練跑起來。
![]()
范式革命:從“精密控制”到“野蠻生長”
這是一種思路的徹底轉(zhuǎn)變。以前我們覺得控制事物得掌控所有細(xì)節(jié),比如工業(yè)機械臂,每個關(guān)節(jié)都得是精密儀器。但人形機器人要面對的現(xiàn)實世界變量太多了,這種思路行不通。
神經(jīng)網(wǎng)絡(luò)是個“黑箱”,經(jīng)驗自己學(xué),但也正因為這樣,任何問題都能丟給它去訓(xùn)練解決。
![]()
機器人領(lǐng)域更偏向工程,它的深度在于如何適應(yīng)現(xiàn)實世界的復(fù)雜。當(dāng)我們深入了解后會發(fā)現(xiàn),我們?nèi)粘D檬謾C、用筷子這些不經(jīng)意的動作,背后都有大學(xué)問。而當(dāng)工程師想讓機器人做這些動作時,才會發(fā)現(xiàn)看似簡單的事,原理竟如此深奧。
![]()
現(xiàn)在你知道了吧?不是日本機器人不行了,是神經(jīng)網(wǎng)絡(luò)這個“新玩法”,徹底改寫了機器人控制的游戲規(guī)則!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.