![]()
![]()
人形機器人在單一任務的泛化能力方面取得較好進展,但是多任務、跨任務的泛化能力仍然相對較弱,影響人形機器人落地應用場景表現
文|周源
編輯|謝麗容
在剛剛落幕的2025年度世界人工智能大會上(下稱“WAIC”)上,具身智能機器人展廳人氣最火爆,滿地跑的機器狗、形態各異的機器人引來觀眾駐足。
據介紹,本屆WAIC上共有超150臺人形機器人同臺競技,是國內人形機器人有史以來最大規模的一次集體展出。且不同于去年機器人多偏向于靜態陳列,今年展出的機器人都主打展示在真實場景里干活的能力。
智元機器人展臺面積達300平方米,也是本次參會具身智能企業中的最大展臺。該公司在展臺設立了工業物流、商業服務、家居、科研教育、文娛表演等五大商業場景,“指派”不同的機器人秀實力:作為主打交互服務的通用人形機器人遠征 A2 負責展臺講解,全程自主導覽無人工參與;精靈 G1 則化身展臺“全能助手”為觀眾遞物品、蓋紀念章;另一款機器人遠征 A2-W 在勤奮地進行拆垛搬運作業,精準抓取不同規格的周轉箱。
銀河通用搭建了 1:1 還原的真實商超場景,由銀河通用機器人Galbot 進行全天候值守。
星動紀元模擬物流倉儲場景,展示機器人進行智能分揀、掃碼、服務等“真干活”的能力。
高盛研究預測,到2035年,全球人形機器人市場規模有望達到1540億美元,更樂觀的假設是,市場規模可能達到2050億美元。摩根士丹利在研報中稱,中國作為全球最大的機器人市場和制造中心,2024年機器人市場規模已達470億美元,占全球總量的40%,預計到2028年將增至1080億美元,年復合增長率達23%。
中信智庫7月27日在WAIC上發布《AI新紀元:砥礪開疆?智火燎原》AI+產業發展深度研究報告。報告指出,目前機器人大模型訓練方式已經開始向端到端大模型+世界模型(物理規則建模)發展,同時模態能力也越來越豐富,但受制于機器人“大腦”泛化能力有限、數據集獲取難度高、結構設計待優化、供應鏈成本居高不下等痛點,人形機器人短期內仍難以實現大規模商用。
![]()
為什么是人形機器人
人形機器人被普遍認為是 AI 最有前景的落地方向之一,未來在工業、商業、家庭、外太空探索等領域具有廣闊應用場景,將人類從低級和高危行業中解放出來,提升人類生產力水平和工作效率。
需要指出的是,人形機器人只是具身智能的一種典型載體,但具身智能的范疇遠不止于人形機器人。具身智能核心在于 “通過身體與環境的動態交互產生智能”,而 “身體” 的形態可以是多樣的,只要具備感知、行動能力并能與環境互動,都可成為具身智能的載體。
中信智庫在報告中指出,采用人形設計出于多種因素考量。
其一,更能適應環境。現實中許多場景,如樓梯、工具等均是根據人體工學設計的,機器人如果是人形就能夠在這些場景中直接應用。
其二,更好的任務通用性。人體具備較高靈活度, 模仿人類的關節、感官系統可讓人形機器人更加靈活,可執行多樣化任務。
其三,類人外觀降低人機交互的心理隔閡,與其他類型相比,未來人形機器人在情感溝通上面臨的壁壘更低。
其四,數據可得性更高。深度仿生意味著可以從人身動作中獲取大量的運動數據,能夠明顯降低深度強化學習等訓練方法的難度和所需的訓練時間。
特斯拉人形機器人Optimus堅持仿人結構。Optimus 機器人身高1.73米,在執行器連接中使用模仿肌腱的彈簧設計,手部形態上模仿人類手掌,從而實現高靈敏度以抓取重物和輕薄物體。
根據特斯拉在今年1月公布的規劃,Optimus計劃在2025年量產數千臺,并在特斯拉工廠進行初步測試;2026年量產5萬-10萬臺,2027年再增加10倍。
今年初開始,車廠紛紛入局人形機器人成為一大趨勢。《財經》根據官方公告不完全統計得出,當前國內已有廣汽、上汽、比亞迪、小鵬、奇瑞、小米等15家車企,以及華為、地平線、禾賽科技等供應鏈企業,相繼投入人形機器人賽道。在海外,特斯拉、寶馬、奔馳、本田、豐田、現代等6家車企也提出了自己的人形機器人思路。全球主流車企基本已入局人形機器人賽道(相關報道見)。
在國內,人形機器人也成為今年資本市場熱度最高的領域之一。7月18日,中國證監會官網信息顯示,宇樹科技開啟上市輔導,估值超120億元。宇樹科技成立于2016年,研究機器狗起家,2023年開始發布人形機器人產品,是國內最受關注的人形機器人創業公司之一。人形機器人公司它石智航已經開啟第三輪融資。今年3月,機器人公司維他動力宣布完成2億元融資,這家公司成立100天,已經完成兩輪融資。
按照估值,目前中國人形機器人創業公司已經形成了鮮明的梯隊,第一梯隊的公司有三家:宇樹科技、智元機器人和銀河通用,估值均超過70億元。第二梯隊的公司則包括它石智航、自變量機器人、逐際動力、千尋智能等十多家,估值在20億元-50億元之間。
![]()
商用難點
盡管人形機器人行業熱度高漲,但仍然面臨著短期內難以大規模商用的行業難題,中信智庫在報告中指出,阻力主要來自以下四個方面。
首先,機器人“大腦”,即具身智能機器人大模型泛化能力有限,導致當前應用場景受限。
具身智能大模型指通過海量多模態數據(視覺、語言、動作)預訓練,具備環境感知→任務理解→動作生成能力的通用智能體模型,逐步實現從“單一指令執行”到“自主決策演進”的躍遷,其核心是讓機器人像人類一 樣“看懂世界,聽懂指令,做出行動”,在工業、醫療、家庭服務等場景推動智能化升級。
中信智庫認為,機器人大模型大致可以參照自動駕駛的技術發展,也劃分為 L1-L5 階段。目前處于L4 階段,該階段特點是實現真實交互反饋,代表模型為谷歌DeepMind于今年3月推出的Gemini Robotics,實現了視覺-語言-動作(VLA)三模態深度融合,具備極強的空間推理。
目前具身智能大模型快速迭代,但仍面臨數據集不夠、思考跟不上運動、缺乏生態等主要痛點,從效果上看,人形機器人在單一任務的泛化能力方面取得較好進展,但是多任務、跨任務的泛化能力仍然相對較弱,影響人形機器人落地應用場景表現。
![]()
數據是具身智能的“認知基石”,目前通用機器人大模型所需數據量極為龐大、且數據獲取難度高,導致短期內通用機器人難以采集足夠數量的真機數據用于大模型訓練。
與語言大模型可以直接學習大量互聯網、書籍知識不同,僅靠觀看互聯網視頻或者人類動作視頻是很難快速提高機器人的運動和規劃能力。
物理AI仿真系統開發商松應科技首席執行官聶凱旋告訴《財經》,人形機器人則需要在真實物理環境中進行大量交互操作的數據來訓練其決策和行動能力,物理世界操作數據的短缺限制了人形機器人的發展。
機器人結構設計仍需優化,零部件可靠性、電池續航等問題亟待解決。
2025 年 4 月,2025 北京亦莊人機共跑半程馬拉松在北京南海子公園開跑。半馬挑戰機器人綜合性能,是對其關節結構設計、熱管理、 電池續航、控制算法、通信干擾、軟硬件耦合等方面的綜合性考驗。
比賽途中多數機器人選手出現運動失衡、摔倒等現象,穩定性較差;同時,不少機器人暴露出散熱問題,需不斷噴灑冷卻液進行降溫。這是因為,機器人的高功率電機、密集的電子元件在持續工作時會產生大量熱量,尤其是在高速持續運動或重載工況下,熱量積累速度很快。而由于人形機器人設計為仿人結構,其內部空間緊湊,熱量難以快速散發。
人形機器人目前續航能力有限,大多數人形機器人續航能力集中在2小時-5小時,難以滿足家庭服務、工業協作等場景的持續作業需求,仍有待進一步提升。
目前,人形機器人的供應鏈成本較高,硬件價格仍需進一步下降。由于人形機器人量產產業規模有限,相關的零部件需求暫未完全釋放,而部分零部件如精密傳感器、行星滾柱絲杠等由于應用場景有限價格較為昂貴,未來產業規模進一步擴大也有賴于供應鏈環節的進一步降本。
(本刊記者劉以秦、研究員黃思韻、特約撰稿人顧翎羽對此文亦有貢獻)
![]()
注添加微信煩勞注明來意、姓名及職業,
歡迎一切良性業務探討及線索提供 !
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.