![]()
你抬起手臂,一旁的機(jī)器人也同步抬起手臂;你往右前方伸手,機(jī)器人也將手伸向右側(cè)……昨天,在一年一度的華為開發(fā)者大會(huì)上,許多人完成了“全身零延時(shí)遙操”人形機(jī)器人的初體驗(yàn)。

所謂的全身零延時(shí)遙操,簡(jiǎn)單說,就是你做什么機(jī)器人就同步做什么。雖然目前同步的只是手臂部分,也足以讓很多人感受到電影《環(huán)太平洋》“人機(jī)一體”的科幻感。
現(xiàn)場(chǎng),你可以操作這臺(tái)名為墨子(型號(hào)Moz1)的人形機(jī)器人堆積木、換紙抽、遞水瓶、疊衣服等動(dòng)作,盡管只有“雙指”,因?yàn)樽龅氖恰凹覄?wù)事”,引來了包括華為高管在內(nèi)的眾多“粉絲”的關(guān)注。
![]()
“如果順利,今年底墨子就會(huì)出現(xiàn)在一些辦公場(chǎng)景里,解決現(xiàn)實(shí)問題。”這臺(tái)搶鏡的人形機(jī)器人來自杭州的千尋智能,創(chuàng)始人韓峰濤是個(gè)80后,浙大背景,從事過工業(yè)機(jī)器人的研發(fā),正帶著墨子們迎接“仰望星空”的時(shí)刻。
這個(gè)“時(shí)刻”出現(xiàn)在劉慈欣短篇小說《朝聞道》中。當(dāng)原始人仰望星空的時(shí)間超過了預(yù)警值,就證明他對(duì)宇宙表現(xiàn)出充分的好奇,成為智慧生命。人類文明將翻開嶄新的一頁。
隨著屬于人形機(jī)器人“仰望星空”的時(shí)刻到來,按照韓峰濤的推算:未來10年,這個(gè)世界上10%的人可以擁有自己的機(jī)器人。
![]()
疊衣服時(shí)會(huì)“抖”一下
從右側(cè)收納筐一堆T恤中緩緩“拿”起一件,拖曳到桌子中央,平鋪;拎起同一側(cè)的袖子和衣角,抖一下、折疊,再拎起另一側(cè)……一鏡到底的視頻畫面中,兩只機(jī)械臂正在進(jìn)行連續(xù)疊多件衣服的任務(wù)。疊完后,它還會(huì)把衣服碼放成一摞。

這段最近在網(wǎng)上很火的視頻,是具身智能創(chuàng)業(yè)公司千尋智能Spirit AI用來展示階段性技術(shù)成果的一段搶先版演示(正式版也會(huì)在近日發(fā)布)。
在機(jī)器人領(lǐng)域,有一個(gè)著名的“莫拉維克悖論”:對(duì)人類來說困難的任務(wù),機(jī)器人可能輕松完成;對(duì)人類而言輕而易舉的本能動(dòng)作,對(duì)機(jī)器人而言卻可能是個(gè)巨大的技術(shù)挑戰(zhàn)。
這也是為什么人形機(jī)器人越會(huì)跳舞、會(huì)打拳、會(huì)鯉魚打挺,越多人發(fā)出靈魂拷問:什么時(shí)候它們能幫我做家務(wù)?哪怕是幫忙洗個(gè)碗、疊個(gè)衣服也好。
全流程疊衣服,就是一個(gè)連續(xù)長(zhǎng)程復(fù)雜任務(wù)。
處理柔軟多變的衣物,涉及動(dòng)態(tài)感知、復(fù)雜操作序列等,遠(yuǎn)比拿取剛性物品更有挑戰(zhàn)。從筐里拿起衣服再折疊,與“折平鋪在桌面上的衣服”,難度也完全不同。在前者的情境中,“每件衣服的褶皺、質(zhì)地和擺放形態(tài)都具有不可預(yù)測(cè)性。”千尋智能創(chuàng)始人兼CEO韓峰濤解釋,這要求機(jī)器人具備實(shí)時(shí)感知和自適應(yīng)調(diào)整的能力。

實(shí)現(xiàn)這一系列流暢操作的核心,是千尋自主研發(fā)的端到端“視覺-語言-動(dòng)作”模型(VLA,Vision Language Action)——Spirit v1。
這個(gè)集視覺、語言和動(dòng)作為一體的多模態(tài)模型,賦予了機(jī)器人動(dòng)態(tài)場(chǎng)景理解與自主決策的能力,能像人一樣感知、理解和行動(dòng),甚至還會(huì)在折疊時(shí)“抖”一下衣服——這一個(gè)小動(dòng)作瞬間“抖”進(jìn)了許多網(wǎng)友的內(nèi)心。
![]()
國內(nèi)首個(gè)高精度全身力控的
具身智能機(jī)器人
洗碗、晾衣服、端茶倒水……我們一直期待著機(jī)器人能勝任各種家務(wù),但泛化能力不足始終是最大障礙。
其中一個(gè)關(guān)鍵的解決方案就在視覺語言動(dòng)作模型VLA。顧名思義,這個(gè)模型的目標(biāo)就是讓機(jī)器既能理解和思考,又能給出符合人類預(yù)期的行動(dòng),無縫打通“感知-理解-決策-執(zhí)行”的閉環(huán)。
近些年,VLA已經(jīng)成為具身智能領(lǐng)域繞不開的關(guān)鍵技術(shù)。6月初,美國明星人形機(jī)器人公司Figure發(fā)布和OpenAI分道揚(yáng)鑣后的最新進(jìn)展視頻:人形機(jī)器人Figure 02在工廠里熟練地干起了快遞分揀員,背后用的就是VLA模型。
在智能駕駛領(lǐng)域,理想已經(jīng)推出了自研的VLA模型。用創(chuàng)始人李想的話來說,“它是一個(gè)司機(jī)大模型,讓汽車像人類的司機(jī)一樣去工作的一個(gè)模型。”
數(shù)據(jù)質(zhì)量決定模型上限,這也是當(dāng)前訓(xùn)練VLA大模型的挑戰(zhàn)之一。千尋構(gòu)建了分級(jí)數(shù)據(jù)訓(xùn)練體系:Spirit v1從海量網(wǎng)絡(luò)視頻學(xué)習(xí)人類行為模式,再通過現(xiàn)實(shí)場(chǎng)景采集的遙控操作數(shù)據(jù)打磨細(xì)節(jié),最終借助機(jī)器人自主試錯(cuò)實(shí)現(xiàn)能力躍升。
“未來模型的進(jìn)化,取決于千家萬戶真實(shí)使用場(chǎng)景的數(shù)據(jù)。”韓峰濤表示。
有了模型和數(shù)據(jù),人形機(jī)器人才有足夠的泛化能力,在行動(dòng)上實(shí)現(xiàn)“舉一反三”。據(jù)韓峰濤介紹,Moz1是“中國首個(gè)擁有真正意義多任務(wù)連續(xù)泛化具身模型”的機(jī)器人,也是“中國首個(gè)擁有全身高精度力控的具身智能機(jī)器人”。
“全身零延時(shí)遙操實(shí)現(xiàn)的人和機(jī)器的高度同步,就是精度和力控的體現(xiàn)。”他說。
![]()
不過,不同于其他同行,千尋智能并不執(zhí)著于“雙足人形”,而是選擇了“類人形”——上半身擬人化設(shè)計(jì)專注操作,下半身則按場(chǎng)景需求靈活定制。“就像交通工具演化出不同形態(tài),未來一個(gè)‘大腦’可以適配各類機(jī)器人身體。”
截至目前,這家成立不到一年半的初創(chuàng)公司已獲得四輪融資,并入選2025杭州準(zhǔn)獨(dú)角獸企業(yè)。3月完成的5.28億元Pre-A輪融資,由沙特阿美旗下Prosperity7 Ventures(P7)領(lǐng)投,也有浙江省科創(chuàng)母基金與浙江東方在杭州設(shè)立的善富科創(chuàng)子基金等的加持,展現(xiàn)出資本市場(chǎng)對(duì)這條技術(shù)路徑的認(rèn)可。
墨子能出現(xiàn)在華為開發(fā)者大會(huì)上也并非偶然。華為全資控股的哈勃科技就是千尋智能的投資方,后者也是華為哈勃在人形機(jī)器人領(lǐng)域的首個(gè)投資標(biāo)的。
![]()
堪比辭職信的萬字長(zhǎng)文
韓峰濤的家鄉(xiāng)是距離杭州1100多公里外的河北石家莊。和很多男孩一樣,他從小就是個(gè)“動(dòng)手派”,喜歡變形金剛,沉迷于組裝遙控飛機(jī)和小車。只不過對(duì)很多人來說玩過就玩過了,而韓峰濤童年折的紙飛機(jī)最終回到了他的手里。
![]()
韓峰濤
從華中科技大學(xué),到浙江大學(xué)控制科學(xué)與工程學(xué)院,對(duì)于機(jī)械的熱愛像一條隱形的線,牽引著他的求學(xué)軌跡。本科期間參加的機(jī)器人世界杯RoboCup的經(jīng)歷尤其難忘,那是他第一次真切感受到機(jī)器人技術(shù)的脈動(dòng)。
2011年畢業(yè)后,韓峰濤先后進(jìn)入國家核電和中國機(jī)械工業(yè)集團(tuán),積累工程經(jīng)驗(yàn)。3年后,“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”的浪潮將他推向工業(yè)機(jī)器人領(lǐng)域。那年也是中國工業(yè)機(jī)器人元年,“機(jī)器換人”的口號(hào)此起彼伏,以應(yīng)對(duì)當(dāng)時(shí)的用工荒。他順勢(shì)創(chuàng)立珞石機(jī)器人,憑借自己在控制技術(shù)上的專長(zhǎng),帶領(lǐng)公司一步步成長(zhǎng)為國內(nèi)高性能輕型工業(yè)機(jī)器人的領(lǐng)軍企業(yè)。
隨之而來的一個(gè)問題是,既然在工業(yè)領(lǐng)域機(jī)器人扮演的角色越發(fā)重要,那它們什么時(shí)候能像科幻片里描繪的那樣走進(jìn)大眾生活?
“在這輪AI技術(shù)出現(xiàn)前,工業(yè)機(jī)器人只能按照預(yù)設(shè)程序執(zhí)行一些重復(fù)性任務(wù),無法在更泛化的場(chǎng)景中使用。”韓峰濤表示,OpenAI的ChatGPT-3.5讓他看到了機(jī)器人“開竅”的可能。
幾乎 在兩年前的這個(gè)時(shí)候,韓峰濤在知乎上發(fā)表萬字長(zhǎng)文《當(dāng)機(jī)器人擁抱大模型》,再次叩問行業(yè)痛點(diǎn)。在他看來,大模型在具備多個(gè)領(lǐng)域的基礎(chǔ)知識(shí)、理解自然語言、連續(xù)對(duì)話、小樣本學(xué)習(xí)等能力,恰好能滿足機(jī)器人在任務(wù)描述、任務(wù)分解、程序生成、任務(wù)交互等方面的需求。
結(jié)論是,兩者結(jié)合將構(gòu)成機(jī)器人開發(fā)人員夢(mèng)寐以求的愿望,即任務(wù)級(jí)編程/交互,“只需要告訴機(jī)器人它要做的任務(wù)是什么,機(jī)器人就會(huì)理解需要做的事情,拆分任務(wù)動(dòng)作,生成應(yīng)用層控制指令, 并 根據(jù)任務(wù)過程反饋修正動(dòng)作,最終完成人類交給的任務(wù)。”
想清楚這些,韓峰濤再也坐不住了。幾個(gè)月后,他離開珞石開啟二次創(chuàng)業(yè)。這次,他想讓AI在物理世界發(fā)揮作用,“最佳載體就是機(jī)器人”。
![]()
在全球頂尖實(shí)驗(yàn)室里
找到志同道合者
在確定創(chuàng)業(yè)方向后,韓峰濤開始了一場(chǎng)特殊的“尋人啟事”。他打開6000多個(gè)好友的列表,期待找到同頻搭檔。花 小 半年時(shí)間與100多人接觸后,最終找到了清華交叉信息研究院的助理教授和博導(dǎo)高陽。
![]()
高陽
在這 輪大 模型和具身智能浪潮的背后,暗藏著一張由全球?qū)W術(shù)精英編織而成的關(guān)系網(wǎng)絡(luò)。他們提供技術(shù)基礎(chǔ),又因?yàn)楫a(chǎn)學(xué)研相結(jié)合的理念,推動(dòng)了這一領(lǐng)域的創(chuàng)業(yè)熱。 其中 ,斯坦福、伯克利、卡內(nèi)基梅隆和麻省理工學(xué)院這四所美國計(jì)算機(jī)名校,構(gòu)成了海外技術(shù)創(chuàng)新的核心策源地。
高陽正畢業(yè) 于 伯克利。他師從計(jì)算機(jī)視覺泰斗Trevor Darrell(特雷沃·達(dá)雷爾),又跟隨強(qiáng)化學(xué)習(xí)領(lǐng)域的大牛Pieter Abbeel(皮耶特·阿布比爾)進(jìn)行博士后研究。后者的實(shí)驗(yàn)室,先后走出了OpenAI聯(lián)合創(chuàng)始人John Schulman(約翰·舒爾曼)等15位知名AI創(chuàng)業(yè)者。
一個(gè)是深耕機(jī)器人硬件的行業(yè)“老兵”,一個(gè)是專注于計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)十余年的科學(xué)家,韓峰濤與高陽前后見了10多次面,從技術(shù)路線聊到公司架構(gòu)、企業(yè)文化,最終達(dá)成共識(shí),千尋智能應(yīng)運(yùn)而生。
“千尋”這個(gè)名字,取“眾里尋他千百度”之意,也暗含著在技術(shù)突破和商業(yè)化路徑探索道路上的“千尋萬找”。在綜合考量人才儲(chǔ)備、生活環(huán)境、創(chuàng)業(yè)氛圍等因素后,他們選擇將公司總部落在杭州。
![]()
未來10年讓10%的人擁有機(jī)器人
“我們的目標(biāo),是構(gòu)建下一代智慧勞動(dòng)力,未來10年讓10%的人擁有自己的機(jī)器人。”在韓峰濤看來,未來5年內(nèi),具身智能可以先在一些細(xì)分場(chǎng)景落地,有了珞石那會(huì)兒的創(chuàng)業(yè)經(jīng)驗(yàn),他說這次從一開始就更多地以市場(chǎng)需求為導(dǎo)向。
“今年底,我們的機(jī)器人就能在公司內(nèi)部為大家服務(wù)了,端咖啡、打印文件、換垃圾袋、整理會(huì)議室……”韓峰濤對(duì)自家產(chǎn)品充滿信心,“年內(nèi)會(huì)交付給客戶數(shù)百臺(tái)初代機(jī)器人,第二代機(jī)型也在研發(fā)中。”
![]()
針對(duì)智能制造、物流、零售、康養(yǎng)及餐飲服務(wù)等應(yīng)用場(chǎng)景領(lǐng)域,千尋都在測(cè)試和驗(yàn)證的規(guī)劃中。
韓峰濤曾在多個(gè)場(chǎng)合提到人才的重要性:具身智能需要最頂尖的大腦,他們值得最豐厚的回報(bào)。目前,團(tuán)隊(duì)的核心成員來自伯克利、卡耐基梅隆、清華、北大等高校,以及字節(jié)、小米、騰訊等企業(yè)。在招聘策略上,也堅(jiān)持瞄準(zhǔn)“頂尖高校計(jì)算機(jī)與人工智能的 高才生 ”。他透露,千尋正在與浙大控制科學(xué)與工程學(xué)院、石虎山機(jī)器人基地等開展深度產(chǎn)學(xué)研合作。
韓峰濤在社交媒體上的頭像,是《灌籃高手》中櫻木花道的Q版形象。“我喜歡這個(gè)角色的特質(zhì)。”在他看來,樂觀和自信恰恰是創(chuàng)業(yè)者的必備品質(zhì),“心態(tài)很重要”。
![]()
創(chuàng)業(yè)的這些年,他放下了踢球、打拳擊、騎自行車等各種興趣愛好,唯獨(dú)留下閱讀科幻小說的習(xí)慣,讓自己能夠站在更廣闊的時(shí)空維度去看問題。
兩年前,在那篇關(guān)于機(jī)器人的萬字長(zhǎng)文結(jié)尾,他引用了《朝聞道》中排險(xiǎn)者和原始人的片段。配圖是經(jīng)典動(dòng)畫電影《機(jī)器人總動(dòng)員》的一張劇照:機(jī)器人瓦力坐在垃圾山上,正仰望星空。
文 | 童蔚
VIEW MORE
@三位杭州“老鄉(xiāng)”助陣,宇樹完成C輪融資 >>
@90后的“昆蟲王國”,每天吃掉富陽1/4廚余垃圾 >>
@生物智造“破壁者”劉旻昊 >>
@“推銷員”王堅(jiān)和三張飛往太空的船票>>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.