馬年春晚,最大的贏家無(wú)疑于是機(jī)器人。一套行云流水的武術(shù)表演下來(lái),把全球電視屏幕前的觀眾全部整高潮了。
電商數(shù)據(jù)也同步反饋,春晚開(kāi)播兩小時(shí),京東機(jī)器人搜索量環(huán)比增長(zhǎng)超300%,客服問(wèn)詢量增長(zhǎng)460%,訂單量增長(zhǎng)150%。新增訂單覆蓋全國(guó)100多座城市。包括除夕當(dāng)晚京東上架的春晚同款機(jī)器人被瞬間秒空。更讓人意想不到的是,兩臺(tái)價(jià)值近63萬(wàn)元的GALBOT通用機(jī)器人G1,同樣被搶購(gòu)。只能說(shuō)土豪真多。
很多網(wǎng)友在調(diào)侃,春晚導(dǎo)演組重倉(cāng)了機(jī)器人股,還有觀點(diǎn)認(rèn)為節(jié)后A股機(jī)器人板塊勢(shì)必大漲等等。
那么,是否就應(yīng)該認(rèn)為,我們的機(jī)器人產(chǎn)業(yè)已經(jīng)馬上要進(jìn)入千家萬(wàn)戶了呢?還有機(jī)器人產(chǎn)業(yè)鏈,明天能不能沖?
![]()
本期內(nèi)容我們就聊聊這個(gè)話題,當(dāng)然以下內(nèi)容并不是投資建議,因?yàn)榍榫w和資金因素是無(wú)法左右的,個(gè)人僅對(duì)了解的內(nèi)容做一個(gè)分享:
先澆一盆冷水,春晚舞臺(tái)上大家看到的武術(shù)表演機(jī)器人,實(shí)際上距離我們想象的,可以陪伴的、替你干活的機(jī)器人,還隔著九九八十一難。
之所以它們能夠流暢的進(jìn)行武術(shù)表演,其核心就是靠動(dòng)作捕捉加預(yù)訓(xùn)練這兩件法寶:
先由真人武術(shù)演員穿著專業(yè)的動(dòng)作捕捉設(shè)備打幾遍,把每一招每一式都轉(zhuǎn)化成精確到毫厘的運(yùn)動(dòng)數(shù)據(jù)。然后工程師上場(chǎng),拿著這批“標(biāo)準(zhǔn)答案”數(shù)據(jù),對(duì)機(jī)器人進(jìn)行瘋狂的“預(yù)訓(xùn)練”,讓它能一絲不茍地復(fù)現(xiàn)這套固定的動(dòng)作序列。
通俗理解就是,你在屏幕上看到的行云流水和穩(wěn)如泰山,是在一個(gè)高度受控的環(huán)境下,經(jīng)過(guò)成千上萬(wàn)次重復(fù)排練的成果。它不是機(jī)器人在臺(tái)上自己琢磨這招白鶴亮翅該怎么發(fā)力,而是在刻板地執(zhí)行一個(gè)早就寫死在身體里的動(dòng)作腳本而已。
所以當(dāng)表演完后,會(huì)看到這些機(jī)器人是跟踉蹌蹌的完成下場(chǎng),需要每臺(tái)配人拿著遙控器像遛狗一樣牽下去。
以上就是春晚機(jī)器人的核心技術(shù)邏輯,是不是距離大家的期望還很遠(yuǎn)。
接下來(lái)談另外一個(gè)話題,如果機(jī)器人要走進(jìn)我們的生活,比如幫我們洗碗,幫我們遛狗、幫我們做飯等這類通用目標(biāo),且具備能聽(tīng)懂、能判斷、能行動(dòng),還能應(yīng)對(duì)各種突發(fā)狀況的能力,還需要攻克哪些技術(shù)難題?
首先,是感知難題:
實(shí)際上,當(dāng)下的機(jī)器人根本不知道它看到的是什么。
比如我們?nèi)祟愖哌M(jìn)一個(gè)從未去過(guò)的房間,掃一眼就能瞬間判斷理解場(chǎng)景的應(yīng)用情況,比如沙發(fā)可以坐,電視機(jī)遙控板怎么按等等。不要小看這些習(xí)以為常的感知能力,因?yàn)樵跈C(jī)器人的世界里,本質(zhì)上這些都是數(shù)字信號(hào)。它需要理解這些場(chǎng)景并做出正確判斷,需要極其強(qiáng)大的視覺(jué)感知模型,以及海量、高質(zhì)量且與真實(shí)世界高度匹配的訓(xùn)練數(shù)據(jù)。
但這又會(huì)陷入一個(gè)先有雞,還是先有蛋的循環(huán):
沒(méi)有足夠強(qiáng)的感知能力,就無(wú)法大規(guī)模部署機(jī)器人去收集數(shù)據(jù),而沒(méi)有海量的真實(shí)數(shù)據(jù),又無(wú)法訓(xùn)練出更強(qiáng)的感知能力。
其次,是操作難題:
比如,手比腿就難上一百倍。讓雙足機(jī)器人穩(wěn)健走路、跳舞已經(jīng)是地獄級(jí)難度了,如果再用手去靈活操作物體,你知道嗎?難度直接飆升幾個(gè)量級(jí)。
我們的人手有27個(gè)自由度,皮膚下密布著觸覺(jué)傳感器,能精確感知物體的重量、質(zhì)地、溫度,還能實(shí)時(shí)微調(diào)抓握的力道。這對(duì)人類是呼吸般的本能,對(duì)機(jī)器人卻是終極噩夢(mèng)。
目前最先進(jìn)的機(jī)器人“靈巧手”,無(wú)論是自由度還是感知精度,都遠(yuǎn)遜于三歲孩童。抓個(gè)雞蛋可能捏碎,拿個(gè)玻璃杯可能打滑。所以,靈巧手是通用機(jī)器人落地最關(guān)鍵的卡點(diǎn)之一,不突破這一關(guān),機(jī)器人就永遠(yuǎn)只是一個(gè)能移動(dòng)的“觀察者”,而不是能干活的“執(zhí)行者”
第三,是決策難題:
這是最核心的,也就是所謂的智能思維。比如你讓機(jī)器人準(zhǔn)備午飯,它需要先分解任務(wù),你自己心里詳細(xì)思考一下要做盤菜出來(lái)涉及哪些細(xì)微步驟,不能有缺項(xiàng),想想就知道背后是極其復(fù)雜的規(guī)劃、推理和即時(shí)決策過(guò)程。
雖然現(xiàn)在頂尖的大語(yǔ)言模型在純文字領(lǐng)域的推理已經(jīng)很強(qiáng)了,但把這種“語(yǔ)言智能”遷移到機(jī)器人身上,讓它能在物理世界里進(jìn)行實(shí)時(shí)的推理、規(guī)劃、執(zhí)行閉環(huán),這個(gè)融合過(guò)程才是最難的部分。學(xué)術(shù)界給這個(gè)方向起了個(gè)名字,叫具身智能,就是讓智能真正住進(jìn)一個(gè)能行動(dòng)的物理身體里。目前,全世界都還在這個(gè)領(lǐng)域的早期摸索階段,離真正的“機(jī)器人靈魂”還非常遙遠(yuǎn)。
說(shuō)到這里,大家是不是認(rèn)為我們又在搞形式主義的自嗨?或者說(shuō)在貶低我們蒸蒸日上的中國(guó)機(jī)器人產(chǎn)業(yè)呢?
其實(shí)并不是。
其一,機(jī)器人產(chǎn)業(yè)是未來(lái)產(chǎn)業(yè)科技高地,我們還是要保持謙虛的姿態(tài),不能盲目驕傲,要知道產(chǎn)業(yè)的痛點(diǎn)、難點(diǎn)是什么,接下來(lái)究竟該怎么搞。要知道中國(guó)進(jìn)入機(jī)器人時(shí)代目前才只是開(kāi)始,還有很遠(yuǎn)的路要走。
其二,春晚這個(gè)舞臺(tái),本身就是一場(chǎng)頂尖的技術(shù)秀,能做到這個(gè)程度,已經(jīng)足夠證明我們?cè)跈C(jī)器人產(chǎn)業(yè)方面的卓越實(shí)力,甚至形成了碾壓級(jí)優(yōu)勢(shì)。
因?yàn)橥ㄟ^(guò)春晚舞臺(tái),我們至少能看到機(jī)器人產(chǎn)業(yè),在2個(gè)方面已經(jīng)站到了全球最頂尖的梯隊(duì)。
第一是硬件制造能力:
中國(guó)的成本控制和供應(yīng)鏈優(yōu)勢(shì),是降維打擊。機(jī)器人最核心的硬件三件套-關(guān)節(jié)、電機(jī)、減速器,決定了它能不能動(dòng)、動(dòng)得好不好、以及能不能便宜量產(chǎn)走向市場(chǎng)。
波士頓動(dòng)力的機(jī)器人,一臺(tái)成本估計(jì)超過(guò)200萬(wàn)美元,幾十年燒錢都燒不出商業(yè)化,這也是它最終無(wú)奈“賣身”現(xiàn)代汽車的根本原因。而像宇樹(shù)的人形機(jī)器人,對(duì)外報(bào)價(jià)大約9萬(wàn)美元,折合人民幣65萬(wàn)左右,在同等運(yùn)動(dòng)性能下,價(jià)格只有前者的二十分之一。宇樹(shù)還在持續(xù)壓低成本,其機(jī)器狗產(chǎn)品價(jià)格已經(jīng)壓到了兩萬(wàn)多人民幣,進(jìn)入了中小企業(yè)買得起的范圍。這背后,是中國(guó)制造業(yè)幾十年沉淀下來(lái)的、實(shí)實(shí)在在的護(hù)城河,全球任何國(guó)家短期內(nèi)都無(wú)法復(fù)制。一旦機(jī)器人行業(yè)邁入規(guī)模化爆發(fā)的奇點(diǎn),中國(guó)的制造優(yōu)勢(shì)將被無(wú)限放大。
第二是運(yùn)動(dòng)控制技術(shù)。以宇樹(shù)為代表的中國(guó)公司,已經(jīng)在和波士頓動(dòng)力這樣的傳統(tǒng)王者正面叫板。讓一臺(tái)雙足機(jī)器人保持動(dòng)態(tài)平衡,每走一步,系統(tǒng)都要實(shí)時(shí)計(jì)算身體重心、地面反作用力、每個(gè)關(guān)節(jié)所需的精確力矩,容錯(cuò)率極低,計(jì)算量極大。
所以,真正值得咱們驕傲的,根本不是“機(jī)器人會(huì)上春晚打武術(shù)”這個(gè)表象,而是在實(shí)現(xiàn)同等甚至更優(yōu)運(yùn)動(dòng)性能的前提下,中國(guó)能用別人二十分之一的成本把它造出來(lái),還能實(shí)現(xiàn)穩(wěn)定量產(chǎn)。這才是硬核的、扎實(shí)的、讓人服氣的實(shí)力。
最后進(jìn)行一個(gè)總結(jié):
我們機(jī)器人的“軀體”和“小腦”(運(yùn)動(dòng)控制)已經(jīng)是世界一流,但缺的是“大腦”和“靈魂”。而面對(duì)感知、操作、決策這三大難關(guān),當(dāng)前全球最主流的破題方向,叫做“世界模型”。在這方面,我們必須清醒地看到,中國(guó)的積累還很薄弱。
世界模型的核心思路,是創(chuàng)造一個(gè)極度逼真的虛擬世界,讓機(jī)器人在里面無(wú)限試錯(cuò)、加速學(xué)習(xí),再把學(xué)到的經(jīng)驗(yàn)遷移到現(xiàn)實(shí)世界中。這條路一旦走通,就能直接打破前面提到的“數(shù)據(jù)死循環(huán)”。
這方面美國(guó)巨頭已經(jīng)形成了密集的布局和強(qiáng)大領(lǐng)先優(yōu)勢(shì),而中國(guó)目前基本沒(méi)有能夠與之全面抗衡的玩家。這不是悲觀,而是清醒。
只有清醒地知道差距在哪里,才知道該把力氣往哪里使。所以,機(jī)器人競(jìng)賽的下半場(chǎng),主戰(zhàn)場(chǎng)是“大腦”,是軟件,是人工智能與物理身體的融合。這場(chǎng)真正決定未來(lái)的硬仗,其實(shí)才剛剛開(kāi)始。我們必須給予春晚機(jī)器人掌聲,但更要把目光投向那掌聲之后,更遼闊、也更艱難的戰(zhàn)場(chǎng)。
更多內(nèi)容,歡迎加入知識(shí)星球《譚談財(cái)經(jīng)》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.