![]()
銀河通用聯合創始人兼大模型負責人張直政,千尋智能聯席首席科學家解浚源,自變量機器人創始人兼CEO王潛,清華大學助理教授、星海圖首席科學家趙行,傅利葉智能創始人兼首席執行官顧捷,加速進化副總裁趙維晨,北京人形機器人創新中心CTO唐劍……
當人形機器人領域的這些活躍人物,出現在云棲大會同一場活動——2025阿里云具身智能行業論壇,氣氛變得微妙起來。
一方面,他們對一個終極愿景抱有高度共識:讓機器人能在家庭和工業場景中自如完成各類任務,最終邁向通用人工智能的“圣杯”。
然而,當話題轉向“如何抵達”這一現實路徑時,瞬間呈現出緊張感,各家的嘗試天馬行空,甚至互不兼容。
有人認為仿真數據能解決99%的問題,也有人直言最核心的數據必須源于現實世界;有人推崇端到端的統一模型,也有人主張分層系統更為實際,還有人試圖跳出非此即彼的框架:“別爭了,其實可以整合到一起。”
就連并未參會的王興興,也因不久前在另一場大會上提出的爭議觀點,被“請”到了臺前。
這其實是一件很有意思且極為重要的事。技術路徑的分化,標志著一個更具深度的探索階段的到來。而在這個過程中出現的每一條岔路,都可能藏著通向終極答案的鑰匙。
![]()
![]()
數據之爭
真機數據還是仿真合成數據?
與文本、圖像等可輕松抓取的互聯網數據不同,具身智能依賴的是機器人與物理世界交互的行為數據。
這類數據天然稀缺、獲取門檻極高,已成為行業共識,但如何破解這一瓶頸成了“非共識”的問題。于是,便有了“真機數據采集”與“仿真數據生成”之爭。
第一位上臺分享的銀河通用張直政,堅定地站在仿真合成數據一方——這兩天湖濱步行街開出的杭州首家機器人售賣店,便是這家公司的商業化嘗試。他認為以仿真數據為主導的路線,不僅能實現千倍訓練效率的提升,長期來看也更具可行性與性價比優勢。

銀河通用機器人貨架取商品
年初,銀河通用就已發布完全基于仿真合成大數據進行預訓練的具身大模型,目前生產出10億級別的仿真合成數據,據說內部已經進一步將數量級擴大至百億和千億級別。
![]()
沒有對上一位演講嘉賓的直接反駁,PPT一放,千尋智能解浚源的立場已不言自明:其中一頁的標題寫著:“唯有高質量的真實數據才能訓練出世界領先的模型。”
![]()
這家帶有浙大+清華基因的公司,構建了一套三級訓練體系:先用海量互聯網視頻預訓練為系統注入先驗認知,再通過真實機器人采集的模仿學習數據進行動作映射,最后通過強化學習將完成度推向接近完美。
真實數據從哪里來?解浚源展示了其中兩種采集方式:一是遙操作(量小但質量高),二是自研可穿戴機械臂(更靈活,成本僅遙操1/20)。

千尋機器人Moz1展示S型壓彎
同樣堅持真機數據為主導路線的,還有星海圖。這家公司新近發布的G0模型,便是基于100%開放的真實世界數據進行訓練:機器人被放在漢庭、如家、711、羅森等真實場景,自主采集人類行為數據,并完成一系列復雜任務。
真機數據>互聯網數據>仿真數據,趙行現場還給數據價值排了個序。
一場論壇遠不足以平息這場持續已久的數據之爭。什么樣的“數據配方”才是最理想的虛實比例?只有等待后續實踐去揭曉了。
![]()
模型之問
大模型如何賦能具身智能?
具身智能的“智”,究竟要怎么衡量?
解讀的維度很多:比如空間智能(對于位置、距離和環境的精準感知),時間智能(記憶過去、預測未來),又比如執行智能(拆解復雜任務并自主執行),泛化能力(將所學遷移到新場景),等等。
當下一個熱門的解決方案,就是VLA(視覺-語言-動作)端到端模型。它試圖讓機器人通過攝像頭“看見”世界,通過自然語言“聽懂”人的指令,并直接執行相應“動作”,從而構建起“感知-理解-決策-執行”的閉環。
“除此之外,還有大小腦分層架構、世界模型,目前技術路線尚未收斂,并行探索。”北京大學計算機學院研究員仉尚航現場對這三類主流算法路徑,做了一個梳理。
大腦+小腦分層路線,采用多模態大模型作為“大腦”負責高層決策與推理,配以專門的“小腦”模型處理底層運動控制,通過分層協作實現更強的任務處理能力。世界模型路線,則代表更前沿的探索,旨在構建對物理世界的完整建模,通過預測未來狀態來優化動作決策。
現場的自變量和星海圖,恰好分別代表了端到端與分層模型兩種方向。前者將視覺、語言、觸覺、動作等所有模態信息,納入一個模型處理;后者則采用“大腦”+“小腦”,一方面減輕算法負擔,另一方面也更符合人體結構。

星海圖機器人疊被子
并未參會的王興興,因此前在2025世界機器人大會上的觀點,在圓桌環節意外被cue。當時,他在公開演講中表示,機器人數據被過分關注了,“現在最大的問題是模型,并不是數據問題。”同時,他對大熱門的VLA持較為懷疑態度,認為這就是一個“相對傻瓜式的架構”,在和真實世界交互時,數據質量、能采集的數據都不太夠用。
有趣的是,剛才還在為端到端與分層路線交鋒的嘉賓,此時卻立場一致,或委婉或直接地表達了對這一觀點的不認同。
文 | 童蔚
VIEW MORE
@時隔8年,又一位未來“預言家”來杭州開講 >>
@彈鋼琴是為了更好地洗碗? >>
@今天,阿里一號位分享了他自己編排的PPT >>
@ 杭州這個創業社區,專門孵化“一人公司”>>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.