機器人真正進入家庭幫助人類做家務還需要多久?4月21日,自變量機器人給出的答案是:35天。
當天,自變量機器人(以下或簡稱自變量)舉行發布會,推出新一代機器人進家庭計劃,宣布35天后搭載WALL-B的新一代機器人將首批入駐真實家庭。
發布會現場,自變量機器人創始人兼CEO(首席執行官)王潛站在舞臺中央,一臺白色輪式雙臂機器人緩緩滑上臺,機械臂夾著垃圾桶,另一只機械臂精準夾起了他演講途中隨手扔下的紙團。這不是提前編好程序的演示,而是機器人自主決策的結果。正是這個人類看似簡單的自主決策的動作,對于機器人能否真正進入復雜的真實家庭,至關重要。
王潛和自變量機器人CTO(首席技術官)王昊會后接受了包括《每日經濟新聞》在內的媒體記者采訪,王潛表示,具身機器人的硬件已經到位了,雙足、靈巧手、力控關節都很好,但大腦沒有跟上,當前,機器人的核心瓶頸不在本體,而在數據和技術。
王潛還提到,無論是用于數據收集,還是驅動整體技術進步,商業化都是一件非常自然的事,因此為了把技術做好,自變量一定要把商業化做好。“我們希望在2至3年里,實現真正意義上的、物理世界的Aha Moment(頓悟時刻),就像當年ChatGPT所做的事一樣。希望Aha Moment,是我們第一個能做出來的。”王潛表示。
![]()
自變量機器人創始人兼CEO王潛 受訪者供圖
談機器人駐家:Aha Moment,在未來非常近的地方
“早上七點,鬧鐘響了。你從床上爬起來,走到客廳。拖鞋不知踢到哪里,廚房的碗還沒洗,孩子的書包扔在地上,貓打翻了一杯水。”王潛用這段描述開場,揭示了家庭環境的實際情況:隨機、碎片、不斷變化。
王潛表示,目前,全球沒有任何一臺機器人可以在無遙控操作的情況下,獨立完成上述場景中的綜合整理任務。他和團隊所做的,是把機器人送進最復雜的真實家庭。
《每日經濟新聞》記者了解到,自變量機器人成立之初,便聚焦于為機器人構建“大腦”,即端到端的具身智能基礎模型。2024年底,公司發布基于VLA(視覺—語言—動作)架構的第一代具身基礎模型——WALL-A。
今年3月,自變量與58同城合作,將搭載WALL-AS模型的機器人送入真實家庭,與保潔阿姨協同作業。不過,正是在這些真實家庭的部署,讓自變量及其團隊看到了VLA架構的“天花板”。因此,自變量推出了全球首個基于世界統一模型架構(World Unified Model,WUM)的具身智能基礎模型,標志著具身基礎模型從VLA架構向原生多模態融合架構演進。
王昊提到,在機器人領域,VLA面臨的最大問題是,視覺、語言、動作三個模塊各自為政,數據在模塊間逐級傳遞,每過一次模塊邊界就發生一次信息損耗。
“視覺學到的豐富信息,傳到動作模塊時,只剩一個模糊的摘要。”王昊解釋稱,更根本的問題在于,VLA模型只能模仿訓練數據中的軌跡,無法真正理解物理世界的規律,它不知道杯子為什么會掉,不知道盤子懸在桌邊會摔碎。因此,自變量最新官宣的WALL-B,具備WUM架構,將視覺、語言、動作、物理預測等所有能力放在同一個網絡中從零開始聯合訓練,消除了模塊間的邊界和數據搬運損耗。
王昊將搭載新架構的機器人認識世界的方式,類比為人類學習使用筷子的過程:筷子掉了無數次,但每一次失敗都在調整手上的控制,最終形成穩定的技能。這種自我迭代機制,使機器人能在真實環境中持續進化。
王潛表示,“等到5月份機器人駐家時,理論上,它應該能處理所有我們讓它做的事情。所有在物理上可觸及范圍內的事情,它都能做。當然,這不代表100%自主完成,必要時還是需要人進行遠程兜底監管,以保證安全”。
“我覺得,機器人進家庭的發展速度,某種意義上要超過大家一般的預期。我還是毫不猶豫地認為,具身智能真正意義上的Aha Moment,應該就在未來非常近的地方,可能比大家想的要近。”王潛進一步指出。
談企業融資:具身機器人融資熱度,仍相對欠缺
備受關注的是,王潛當日同時對外證實了公司剛完成近20億元的B輪融資,這輪融資由小米戰投與紅杉中國聯合領投。至此,自變量機器人成為國內唯一一家同時獲得字節跳動、美團、阿里巴巴、小米四家互聯網巨頭投資的具身智能企業。
公開數據顯示,2026年以來,國內具身智能及機器人賽道已披露融資總額接近200億元,百億元估值公司增至13家,熱錢確實在涌入。但在王潛看來,與移動互聯網、自動駕駛等大級別的技術浪潮相比,具身智能仍處在早期階段,“我覺得影響還是弱的,和之前的大級別機會相比,熱度還是欠缺的”。
即便是在這樣一個尚未真正“熱起來”的賽道上,自變量實現了行業內罕見的被四家互聯網巨頭集體押注。從融資歷程來看,自變量幾乎走了一條“一輪一個巨頭”的獨特路徑:A輪美團、A+輪阿里、A++輪字節、B輪小米。
“為什么能夠吸引這些大廠投資?我很難給出一個行業通用性的回答。”王潛在接受采訪時坦言,“所有這些投資人投我們的邏輯,其實非常簡單,就是投技術上的領先性。這幾家大廠也在做大W模型,應該是全世界做大模型最好的幾家公司之一,他們自己的技術判斷力很強,他們需要投某種意義上的技術第一性、技術驅動的事情。”
對于未來可能面臨的和巨頭競爭等問題,王潛表示:“大廠投資我們,也恰恰說明了創業公司的獨特優勢。市場足夠大,創業公司在軟硬一體的能力、技術本身的壁壘上,具有優勢。”
在王潛看來,資源不構成壁壘,技術才是最大的壁壘。大模型歷史上,Google等大廠投入巨量資源,但追趕OpenAI依然用了很長時間。“為什么大家會認為,在大模型的時代技術門檻變低了,因為有蒸餾,蒸餾做得太多了,以至于忘了什么是真正的技術差距了,但機器人沒法蒸餾,技術壁壘會更高。”王潛表示。
談商業化落地:是數據來源,更是技術迭代的加速器
值得注意的是,從一直以來的發展路徑看,自變量給外界的印象是不急于商業化變現。當被問及為何在此時推出家庭產品時,王潛表示,“我們一直都秉承技術第一性,核心目標還是首先要達到大模型那樣的里程碑。這個階段的商業化,是為這個目標服務”。
“為了把技術做好,我們一定要把商業化做好。”王潛總結稱,在他看來,商業化不僅是數據來源,更是技術迭代的加速器。
“在真實場景里,有很多物理上的限制,你不去做就不可能會知道。”王潛說,從硬件設計到數據,再到模型,都會有這種反饋。在他看來,一個產品之所以不只是實驗室里的研究品,是因為它終究要和足夠大、足夠廣闊的世界交互。
在數據策略上,王昊做了一個生動的比喻:行業內大多數訓練數據來自實驗室,固定光照、固定位置、無干擾環境,他稱之為“糖水數據”,干凈但脫離真實。而自變量的團隊進入數百個真實家庭采集的數據,則被比喻為“牛奶數據”,嘈雜、多變、充滿隨機性。自變量的策略是以實驗數據打底、真實場景提質,讓模型學會在不確定環境中生存。
關于機器人進家庭會涉及的隱私問題,王潛也給出了明確的解決方案:視覺脫敏,據他介紹,機器人在設備端會對原始圖像進行實時打碼處理,同時,機器人在用戶主動按下同意鍵后方可開機,不存在“默認同意”的情況。而對于機器人在家庭中采集的圖像,王潛表示,系統絕不共享第三方,機器人只認一個主人,發現可疑指令立即鎖定。
不過,盡管對技術前景保持樂觀,王潛依然將現在的機器人定位為“實習生”。這意味著機器人進入家庭,前期可能會犯錯,需要人類遠程協助。它可能把拖鞋放到廚房,擦桌子可能擦到一半停下來“思考”。但它的優勢是24小時不間斷工作,每工作一天都會因新數據而變得更聰明。
“進入家庭的機器人,現在還很笨,走得很慢,經常犯錯。但人類從嬰兒時期邁出的第一步也是如此。每一個偉大的旅程,都是從踉踉蹌蹌的第一步開始。如今,機器人已經在最復雜的地方開始了它學習和進化的征程。”王潛表示。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.