![]()
12月初,國內兩所領先高校先后推出了具身智能專業。這像是產學屆一次盛大的牽手,讓觀眾們幻想屬于國產具身智能的美滿未來。
12月8日,智元機器人宣布5000臺產品量產。2025年是國內具身智能飛速發展的一年,從年初登上春晚舞臺,到年末進入頂級學術殿堂。具身智能賽道的參與者越來越多,而對其的理解也越來越豐富多元。
有人認為,具身智能是AI的物理表征,有人認為,具身智能是新的交互范式;你難以找到一個所有人都同意的定義,但有一個觀點人人認同:具身智能跟我有關。
01
具身智能做不了什么?
大模型時代里,所有的工業體系都值得被重新做一遍。
樂觀者們在問“具身智能不能做什么?”
旁觀者們在看,“具身智能可以疊衣服、可以做物流,可以踢足球,可以吸引人,還可以......”
繁榮的demo和真實的落地之間還存在巨大的差距。為了融資,具身智能們燃盡“想象力”demo可以展示一種能力,但不同的demo體現的卻不一定展示了不同的算法能力。目前行業出現了一種“橫向擴展”demo的現象,即所有的“花樣”其實是“一樣”,用相同元素的排列組合,營造一種虛假的繁榮。這樣的矛盾是具身智能擴張與技術積累的平衡之難;太深的技術積累,會導致投資太高,難以出成果,以至于被淘汰。
demo遍地,12月已至具身智能尚未落地。第一個原因是,具身智能的能力還沒有達到規模化的門檻。討論具身智能的能力,要看具能智能簡單任務的成功率、節拍、成本、可靠性。
雖然一些具身智能高度結構化的實驗室環境下表現穩定,任務成功率可能超過80%,但如果放到真實環境下其成功率可能大幅度降低。更重要的是,即便單個任務成功率能提高,但是對于長程任務來講,其成功率是相乘的結果,而小于1的數字相乘,得到的結果自然只會更低。
具身智能的真正落地既要找到合適的場景,也要保證成功率的提高。這條路要走多久還未可知,但可以確定的答案是具身智能的規模增長與demo的增長并不是絕對的正相關。就像狼來了的故事,人們曾在2015年聽過“這一年是具身智能的元年”
02
具身智能的chatgpt時刻
具身智能要在真實世界得到應用,讓所有人都想去用它,才會出現chatgpt時刻。
資本急于開拓具身智能的使用場景,但具身智能的公司們卻還要思考如何應用,在哪些場景應用。12月3日,特斯拉展示了機器人奔跑的視頻。是的,具身智能跑起來了,然后呢?在怎樣的場景下,需要機器人替代人類去跑步呢?
產業現在將具身智能未來落地方向主要歸結為三個場景:商業服務場景、工業場景、家庭場景。具身智能落地的順序也很大概率會是先商業服務再工業服務最后走進家庭。
這樣的順序主要因為具身智能的需要大量的數據訓練,以建立一個世界模型。在這個模型之中,具身智能要可以思考,也可以預測下一步。然而,就像一個雞與蛋的問題,因為具身智能不具備實際場景中大量采集數據的機會,導致也就無法快速地去建立模型。商業場景特別是酒店類,因為環境較為固定更容易訓練,從價值來看,送餐機器人確實也解決了人力成本。
工業場景對效率要求高,替代自動化的效率會是硬性門檻。我們看到,即便機器人能夠完美復刻一些工業操作,但相對于人手來講,其速度并不占優勢。從用戶側來說,付費購買更慢的“人力資源”是一個虧本交易。從技術側來說,由于工業場景碎片化,數據難收集,因此難以起量,就更難打破成本、效率的限制。
最后,再說說家庭服務。對于具身智能進入家庭的前景其實有兩個極端的角度,如果說只需要期待陪伴、對話作用,或許具身智能可以很快的進入消費領域。畢竟從智能家居開始,到現在的AI玩具,已經人機交互已經不是新鮮事。但是如果具身智能要真正成為一個家庭的“家庭成員”,那它面臨著安全,以及成本問題。而被定義為“家庭成員”的具身智能多是覆蓋醫療、養老場景,審視其安全性更要慎重。
對于具身智能的普及之路,過程大概是從專精到通用。最開始,可能是單場景單任務的穩定執行;然后過渡到單場景多任務的執行;最后是,多場景多任務的穩定執行。
具身智能的發展也需要行業的共識,即一套基準測試,運動會賽不出具身智能的真差距。這一點的突破需要產學研的結合。學界方面,除了清華大學、上海交大已經宣布增設具身智能專業,還有一批國內高校正在申請具身智能專業。
03
具身智能的繁榮與焦慮
千百年來,人們一直夢想著造出某種人造物,能自動完成憑借人類智慧、能力才能實現的工作。
在荷馬史詩《伊利亞特》中,掌管鍛造、雕刻的鐵匠之神赫菲斯托斯造出了金屬機器人和黃金打造的仆人,幫助他完成雜務。亞里士多德預言了自動化工具的出現,讓勞動變得不再必要。《列子》中講述了工匠偃師為周穆王制作了一個栩栩如生、能歌善舞、甚至有感情的“機關人偶”。《格列佛游記》中描述了一個機械裝置,有了它,“最愚蠢無知的人也可以撰寫哲學、詩歌、政治、法律、數學和神學方面的書籍,不必憑借天賦或加以學習”。
過去,人們對具身智能的暢想總是,替代人類去做無聊的、重復性的、低價值的工作;于此同時人們又擔心他們發展成為“掌控”人類的神,2025年圍繞AI對人力的沖擊就印制了這一點。因此具身智能的未來,不一定是替代重復性的工作,或許讓他們能夠替代人類進行危險工作,才更有意義。
雖然焦慮具身智能的未來,但具身智能帶來了相當多產業的繁榮。對于芯片行業來說,一大批芯片廠商找到了產品的新增長空間。
邊緣端,多家國產芯片廠商發布具身智能產品。極海發布G32R501實時控制MCU可滿足具身機器人在感知與決策、運動控制以及高效人機交互等方面的高算力、高效率與高精準度等性能需求。以“MCU+Driver+IPM”全棧式電機專用芯片為核心,搭配極海自研電機算法平臺,可應用于機器人關節、工業編碼器、無框力矩電機等核心場景,構建具身智能“神經中樞”。
國民技術N32H7系列MCU憑借多核異構架構與超高主頻,提供強大算力與實時響應能力,能夠滿足人形機器人對復雜控制與高同步性的嚴苛要求。其內置的CORDIC協處理器能夠高效完成運動學涉及的三角/坐標變換等數學計算,顯著釋放CPU負載。
全志科技MR系列機器人芯片采用12nm制程,集成CPU+GPU+NPU異構架構,算力達3-4TOPs,功耗僅5W,支持毫秒級響應,為小米CyberDog、宇樹Unitree系列等產品提供運動控制和環境感知核心算力,成本僅為英偉達Jetson Nano的1/3。
瑞芯微的RK3588采用八核64位ARM架構 ,4顆cortex-A76 高性能內核(主頻達2.4GHz)與4顆Gortex-A55 能效內核(主頻2.0GHz)組合多任務處理和復雜計算能力出色。內置6TOPS 算力的NPU,支持多種數據類型與主流深度學習框架,能高效處理圖像識別、語音交互等A任務。業內人士透露,瑞芯微面向具身智能行業已經出貨上萬片相關產品。
佰維存儲表示已推出適用于具身智能領域的eMMC、UFS、BGA SSD、LPDDR4X/5/5X 等產品,并積極拓展具身智能領域頭部客戶。根據第三方媒體拆解報告,宇樹科技的Go2智能機器狗中已應佰維存儲的LPDDR4X、eMMC存儲產品。
算力端,英特爾、英偉達仍是機器人“頭部”算力的核心玩家。正如前文所說,具身智能的VLA需要構建世界模型,而構建模型必然帶動算力需求。英特爾通過推出GPU+NPU+CPU的異構系統,滿足運動控制、AI推理的不同負載要求,實現VLA模型運行。
此外,除了聚焦硬件,英偉達推出了NVIDIA Cosmos 平臺以加速物理AI。該平臺可以整合前沿生成式世界基礎模型 (WFM) 先進分詞器、護欄以及用于加速數據處理和管理的高效工作流的集成平臺。為世界模型訓練提供支持,并加速智能汽車(AV) 和機器人的物理 AI?開發。
因為涉及機械控制、邊緣算力等緩解,具身智能的芯片供應商和汽車芯片的供應商具有很高重合度。而具身智能的發展和汽車的發展也有了一些相似之處。
1885年,卡爾·本茨 制造了第一輛使用汽油內燃機驅動的三輪車。或許,機器人現在的“社會角色”就像和汽車在1900-1910 年:是技術奇觀,卻不是社會基礎設施。而現在汽車已經成為隨處可見的普通角色,具身智能的發展還要一定時間,但不會是百年之久。
確定的是,我們看到的是具身機器人角色還沒定型,但不是能力不足。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.