前不久春晚舞臺上,一段人形機器人的表演點燃了不少觀眾的熱情。流暢的動作、整齊的編排,讓很多人直呼“遙遙領先”。
緊接著,一段短視頻又在平臺上迅速傳播:畫面里,中國士兵一聲令下,春晚“同款”機器人完成機動、交替、掩護、射擊、換彈,一氣呵成,仿佛已經具備戰術能力。
不少人由此得出結論——具身智能已經可以上戰場了。
但事實真是如此嗎?
今天我們不賣關子:
春晚表演,本質上是基于預設程序的演出編排;
而那段“戰術視頻”,則是AI生成的合成內容。
不過,問題并沒有因此失去意義。
真正值得思考的是:
如果未來AI+人形機器人要走向軍事或高復雜場景應用,它還差什么?需要多久?又會在哪個國家率先成熟?
這篇文章,我們把“具身智能”拆開講清楚。
![]()
一、什么是具身智能?
簡單說四個字:AI有了身體。
過去幾十年,機器人早已存在。工業流水線上的機械臂,就是最典型的代表。它們強壯、精準,但非常“死板”。一旦環境變化,系統就會失效。
而今天的大模型時代,AI擁有了理解能力。
當AI不再只存在于服務器,而是被裝進一個物理軀體里,它就從“會說話的軟件”,變成“能行動的存在”。
我們可以把具身智能拆解成四部分:
1. 軀體(腿和手)
2. 感知系統(視覺+觸覺)
3. 大腦(芯片與算力)
3. 靈魂(大模型)
下面一塊一塊說。
![]()
二、軀體:腿容易,手最難
1)腿部:技術已相對成熟
談到雙足行走,就繞不開Boston Dynamics(一家美國機器人公司)。
它們最新的全電動Atlas擁有50多個自由度,跌倒后可以用非人類方式折疊身體再站起。翻跟頭、跳躍都不是問題。
腿部控制,本質是“和地面博弈”。
一旦掌握平衡與重心轉移的循環邏輯,就可以在不同地形上復用。
開源社區已經有大量成熟算法。
在行走這一塊,軟件甚至走在硬件前面。
但——
2)手部:真正的難關
走路是周期任務,
手部操作幾乎都是非周期性的。
一只仿生靈巧手通常有15~20個自由度。
自由度一翻倍,控制空間指數級增長。
人類之所以能創造文明,靠的正是雙手。
目前的突破方向,是盡量“像人”。
以挪威公司EXOS的腱驅動設計為例(行業常見方案),
電機放在前臂,手指內部只有高強度纖維繩索模擬肌腱。
好處是什么?
- 慣性小
- 可以高頻微調
- 出現誤差時會“自適應形變”
這讓機器人真正有機會進入家庭,而不是只存在于圍欄內的工廠。
在軍事層面也是一樣——
如果沒有靈巧手,連“扣扳機”“換彈夾”都做不到。
三、感知:看得見,還要摸得著
光有四肢不夠,機器人必須理解環境。
1)視覺系統
目前走純視覺路線的代表,是Tesla(特斯拉)的 Optimus。
它背后的核心是FSD視覺架構。
不同于依賴激光雷達的路線,特斯拉通過多攝像頭數據融合構建3D體素空間,并用占用網絡預測遮擋物體。
更重要的是數據規模——
全球數百萬輛車每天采集真實世界視頻數據。
數據量,就是AI的糧食。
![]()
2)觸覺系統:最后一塊拼圖
視覺之外,人類還有一項與生俱來的能力——觸覺。
近年出現的新趨勢,是全身覆蓋數字觸覺皮膚。
這種電子織物每平方厘米上千個傳感單元,
并通過邊緣計算在“皮膚層”先處理90%的數據,只把關鍵變化傳給中樞。
這解決兩個關鍵問題:
- 遮擋環境下的盲操
- 精細力度控制
比如在黑暗環境中維修設備,或者精細焊接。
沒有觸覺,機器人只是“看著干活”;
有了觸覺,它才開始“真正接觸世界”。
![]()
四、大腦:算力與芯片
這一塊的主導者幾乎沒有懸念——
NVIDIA(英偉達)。
NVIDIA推出的機器人原生芯片平臺,強調數字孿生仿真訓練。
在虛擬世界中進行高速物理模擬,再把模型直接部署到實體機器人。
這意味著——
未來機器人可能實現“即插即用式學習”。
誰掌握算力,誰就掌握進化速度。
五、靈魂:大模型才是關鍵
如果說芯片是大腦硬件,那么大模型就是靈魂。
當前主流路徑包括:
- Google(谷歌)的 Gemini
- 特斯拉自研模型
- 多家初創公司的人形機器人VLM方案
最前沿的方向,是把感知、決策、控制三段式結構,壓縮為端到端神經網絡。
不再是“識別—規劃—執行”,
而是類似人類的“看到就動”。
這會帶來一個關鍵能力——
在復雜環境中保持連續動作,不抽搐、不報錯、不僵死。
如果未來要用于軍事或災害救援,這種連續性至關重要。
![]()
六、人形一定是最優解嗎?
很多人會問:
既然要軍事化,為什么非得人形?
直接給機器人裝武器不是更高效?
這個問題看似合理。
但我們忽略了一點——
現有武器系統,幾乎全部圍繞“人類形態”設計。
槍械、車輛、建筑通道、掩體結構,都是基于人類尺寸與生理構造。
如果不是人形,就需要為每一種武器重構接口。
成本極高。
人形的優勢,不在殺傷力,而在泛用性。
它可以:
- 第一階段持槍
- 第二階段搬運傷員
- 第三階段駕駛載具
而不需要更換平臺。
![]()
七、中國處于什么位置?
很多人會注意到,春晚機器人來自中國企業。
以宇樹科技為代表,
中國的人形機器人出貨量確實在增加。
但應用場景目前更多集中在:
- 教育
- 展示
- 表演
相比之下,歐美公司更傾向直接瞄準工業和社會生產。
中國真正的優勢在哪里?
在供應鏈。
長三角和珠三角,機器人核心零部件可以在一小時車程內集齊。
諧波減速器、交叉滾子軸承、微電機、力傳感器,全產業鏈密集分布。
規模化能力,可能比單點技術更重要。
歷史上,中國在很多行業的勝出,并非最早發明,而是最早實現大規模、低成本。
具身智能,未必例外。
![]()
八、真的會走向“終結者”嗎?
很多人擔心:
機器人會不會搶工作?
會不會變成無人士兵?
從現實來看——
距離科幻電影還很遠。
真正的瓶頸并不在“殺傷能力”,
而在泛化能力、能源密度、材料強度與系統穩定性。
更現實的問題是:
當機器人成本低于人工,
誰更有性價比?
那一天到來時,變化才會真正發生。
結語
春晚的機器人,是舞臺藝術。
短視頻里的戰術畫面,是AI合成。
但這不妨礙我們正視一個趨勢:
AI正在獲得身體。
具身智能正在經歷百花齊放階段。
歐洲強調人文與安全,
美國強調突破與野心,
中國強調規模與成本。
未來會如何演變,沒有人能給出準確時間表。
但可以確定的是——
真正的革命,不是某一段視頻,
而是當AI真正能在現實世界中持續、穩定、低成本地完成復雜任務。
那一刻,變化才算真正開始。
在那之前,
我們既不必盲目興奮,也不必過度恐懼。
保持理性,比情緒更重要。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.