設(shè)計(jì)服務(wù)于場(chǎng)景,而不是炫技。
在最近的人形機(jī)器人討論中,特斯拉Optimus常常被拿來與波士頓動(dòng)力的Atlas進(jìn)行對(duì)比,并出現(xiàn)一種聲音:“完全擬人可能是多余的,甚至是一種限制”。
尤其當(dāng)Atlas展示出旋轉(zhuǎn)關(guān)節(jié)、左右腿對(duì)稱等“反人類”設(shè)計(jì)時(shí),不少人認(rèn)為這是一種“更先進(jìn)的第一性原理”。
但這可能是一種危險(xiǎn)的誤解。
01
何為人形的第一性原理?
人形機(jī)器人的“第一性”,是為“人”服務(wù),而非落地。
特斯拉Optimus之所以堅(jiān)持完全擬人設(shè)計(jì),并不是因?yàn)轳R斯克迷戀“人類形態(tài)”,而是因?yàn)樗嘞M蔀橐环N“通用人形”,第一目標(biāo)場(chǎng)景也是“人類世界”。
一句老生常談但正確的理念是,人類世界的工具、空間、動(dòng)線、界面,都是為人設(shè)計(jì)的。門把、方向盤、樓梯、座椅、開關(guān)、貨架……這些都不是為“可旋轉(zhuǎn)關(guān)節(jié)”或“對(duì)稱雙腿”設(shè)計(jì)的。
Optimus的類人結(jié)構(gòu),本質(zhì)上是對(duì)現(xiàn)有環(huán)境的無(wú)縫適配。
![]()
而Atlas的設(shè)計(jì),更像是一種“實(shí)驗(yàn)室與工廠最優(yōu)”,它在特定任務(wù)中效率極高,比如搬箱子、旋轉(zhuǎn)身體。但如果讓它去開一輛普通汽車、操作一臺(tái)標(biāo)準(zhǔn)機(jī)床、或在狹窄的居家環(huán)境中端茶倒水,它的“反人類”結(jié)構(gòu)與維修難度反而會(huì)成為障礙。
筆者一直認(rèn)為,擬人不是模仿,而是“兼容性”。
反對(duì)Optimus的人常提出:“人類五根手指不是最優(yōu)設(shè)計(jì)”“人類轉(zhuǎn)身需要三步”。這看似有理,卻忽略了系統(tǒng)兼容性成本。
如果你要改造全世界所有工具、所有空間、所有界面,去適應(yīng)一種新形態(tài)的機(jī)器人,那開發(fā)新型部件并且產(chǎn)業(yè)化的成本將是天文數(shù)字。
而Optimus的邏輯是:不改變世界,只改變機(jī)器人。
它的雙手能使用現(xiàn)有工具,它的雙眼視角與人相近,它的步態(tài)能適應(yīng)現(xiàn)有樓梯和門檻。這是一種“以機(jī)器人適應(yīng)人”的務(wù)實(shí)哲學(xué),也是其能在工廠、家庭、倉(cāng)庫(kù)等場(chǎng)景快速適配落地的根本原因。
![]()
02
人形機(jī)器人進(jìn)化的根本是什么?
訓(xùn)練數(shù)據(jù)不是問題,而是護(hù)城河。
有人說:“Atlas的形態(tài)用不上人類視頻數(shù)據(jù),但強(qiáng)化學(xué)習(xí)可以解決。”
這句話只說對(duì)了一半。強(qiáng)化學(xué)習(xí)確實(shí)能提升特定任務(wù)的性能,但無(wú)法替代海量人類行為數(shù)據(jù)所蘊(yùn)含的“常識(shí)”與“泛化能力”。
人類每天在進(jìn)行的上千種日常動(dòng)作——開門、搬運(yùn)、避障、協(xié)作,這些已經(jīng)被記錄在無(wú)數(shù)視頻中。Optimus可以直接利用這些數(shù)據(jù)進(jìn)行模仿學(xué)習(xí),快速掌握“在人類環(huán)境中如何行動(dòng)”。
而Atlas如果要完成同樣任務(wù),這類新構(gòu)型就需要重新進(jìn)行大量仿真和實(shí)體訓(xùn)練,時(shí)間成本、試錯(cuò)成本、數(shù)據(jù)收集成本都將顯著增加。即使通過世界模型做仿真,這套邏輯的成本依然會(huì)高出很多。
從供應(yīng)鏈與成本層面看更是如此,因?yàn)镺ptimus正在走特斯拉的老路。
有人稱贊Atlas“只用兩種執(zhí)行器,降低成本”。但特斯拉在Optimus上正在做一件更重要的事:規(guī)模化、標(biāo)準(zhǔn)化、一體化。
![]()
Optimus使用的執(zhí)行器、傳感器、芯片,很多與特斯拉電動(dòng)車共享供應(yīng)鏈。這種“跨界復(fù)用”帶來的成本降低,遠(yuǎn)高于設(shè)計(jì)上的簡(jiǎn)化。
更重要的是,特斯拉正在構(gòu)建一個(gè)從硬件到軟件的全棧閉環(huán),包括仿真訓(xùn)練、數(shù)據(jù)引擎、自動(dòng)駕駛技術(shù)遷移等。這是一種系統(tǒng)級(jí)的降本路徑,而不只是關(guān)節(jié)設(shè)計(jì)上的取舍。
從車輛的“感知-預(yù)測(cè)-規(guī)劃-控制”到機(jī)器人的“視覺-場(chǎng)景理解-動(dòng)作規(guī)劃-關(guān)節(jié)控制”,特斯拉構(gòu)建了統(tǒng)一的多模態(tài)決策網(wǎng)絡(luò),這意味著Optimus可以像自動(dòng)駕駛系統(tǒng)一樣,在動(dòng)態(tài)環(huán)境中實(shí)時(shí)做出長(zhǎng)序列任務(wù)分解與運(yùn)動(dòng)規(guī)劃。
03
不可忽視的“通用性”因素
在討論人形機(jī)器人的落地下,情緒價(jià)值與接受度會(huì)是第二階段不可回避的問題。
機(jī)器人最終要走進(jìn)家庭、醫(yī)院、商場(chǎng),與人親密接觸。一個(gè)看起來、動(dòng)起來像人的機(jī)器人,無(wú)疑更容易被接受。
Optimus的柔和線條、擬人步態(tài)、自然手勢(shì),不是多余的“裝飾”,而是降低人類抵觸心理、促進(jìn)協(xié)作的重要設(shè)計(jì)。Atlas的“臺(tái)燈頭”和機(jī)械旋轉(zhuǎn)動(dòng)作在工廠也許可行,但在幼兒園、養(yǎng)老院、零售店呢?
Optimus的野心,是成為“通用人形機(jī)器人”,這才是資本更期待的未來。人形進(jìn)工廠的任務(wù)替代率10%必然只是短期答案。
筆者看來,Atlas更像一個(gè)“特種機(jī)器人”,在特定任務(wù)上極其出色。
而Optimus的定位是“通用人形機(jī)器人”,它不追求在單一任務(wù)上做到極致,而是追求在人類世界中做到全能。
![]()
特斯拉Optimus的真正意義,不在于是否像人,而在于是否“能用人所用、代人勞作”。它代表的不只是一臺(tái)機(jī)器人,更是一套可擴(kuò)展、可訓(xùn)練、可量產(chǎn)的生產(chǎn)力系統(tǒng)。
如其在電動(dòng)車領(lǐng)域重新定義汽車制造與智能駕駛,特斯拉在機(jī)器人領(lǐng)域的最大貢獻(xiàn),或許是證明人形機(jī)器人不僅可以被造出來,更可以被大規(guī)模造出來、用起來、普及開。
這就像智能手機(jī):它不是相機(jī)中最專業(yè)的,不是音樂播放器中音質(zhì)最好的,但它是最兼容、最便攜、最全面的設(shè)備。
特斯拉Optimus走的,正是這樣一條路:不過度設(shè)計(jì),不標(biāo)新立異,而是用最接近人類的形態(tài),做最能融入人類世界的事。
這或許不夠炫酷,但很可能,這才是真正的最優(yōu)解。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.