一周前,兩位手握多個知名具身項目的博士——趙子豪(Tony Zhao)與遲宬(Cheng Chi),官宣攜手創(chuàng)業(yè)。
今天,他們的首款產(chǎn)品發(fā)布了。
沒錯,這兩位“具身頂流博士”推出的產(chǎn)品,是一款名為 Memo 的家庭機器人,隸屬 Sunday.ai 公司。
視頻中的 Memo 外形呆萌,戴著橙色棒球帽,使用輪式底盤,擁有三節(jié)可升降的身體和兩個抓手,手的設(shè)計類似人類的三指并用。
![]()
*Memo帽檐下有攝像頭
![]()
*手部攝像頭
![]()
*全身照
它的定位是整理家務(wù)——不論是整理衣物、沖咖啡,還是洗碗、清理垃圾,都能靈活勝任。
主打家用不稀奇,但從視頻來看,Memo 的特點是能干很多細致的家務(wù)活。
比如收拾餐桌時一只手拿起兩個紅酒杯,拿走立著的刀叉,這種普通人容易打翻、劃傷的工作,它看起來干得十分輕巧。
疊襪子這類需要非常精細操作的工作,Memo也能勝任。
官推介紹,Memo 是經(jīng)過 18 個月的秘密研發(fā)、數(shù)十個原型、數(shù)百萬次的真實家庭演示后才推出的產(chǎn)品,會在2026年 Beta 測試。
具身新星輟學(xué)創(chuàng)業(yè),知名VC已投
創(chuàng)立 Sunday 之前,這兩位創(chuàng)始人已經(jīng)小有名氣,是具身領(lǐng)域的新星。
![]()
*Sunday創(chuàng)始團隊和Memo
Sunday CEO 趙子豪之前是斯坦福的博士生,也在 DeepMind、特斯拉和 GoogleX 等公司工作過。
他在斯坦福的博士導(dǎo)師是 Chelsea Finn,機器人學(xué)習(xí)和強化學(xué)習(xí)領(lǐng)域的知名學(xué)者。在讀期間,他和同導(dǎo)師同學(xué)一起做的“斯坦福的煎蝦機器人”(Mobile ALOHA)因為成本低又開源,被很多團隊拿去應(yīng)用。

本科階段,趙子豪還師從機器人+強化學(xué)習(xí)大神 Sergey Levine和 Dan Klein。現(xiàn)在,他已經(jīng)從斯坦福輟學(xué)全職創(chuàng)業(yè)。
![]()
聯(lián)合創(chuàng)始人遲宬就讀于哥倫比亞大學(xué)和斯坦福大學(xué),師從知名華人學(xué)者宋舒然。
遲宬這兩年作為核心貢獻者參與的項目 UMI、Diffusion policy 也非常出圈。UMI 可以低成本、高質(zhì)量地采集數(shù)據(jù),之前已經(jīng)引發(fā)業(yè)界紛紛跟進。Diffusion policy 能讓機器人的動作控制更靈活流暢。
![]()
兩位學(xué)界新星首次創(chuàng)業(yè),得到不少圈內(nèi)大神的助力。
今天遲宬在推特上發(fā)文感謝英偉達的 JimFan 幫忙介紹硅谷知名 VC Sarah Guo。后者現(xiàn)在已經(jīng)是 Sunday 的投資人。
![]()
之前 AK 等 AI 風(fēng)向標(biāo)也圍觀過 Sunday 的成果。
![]()
*Memo 未發(fā)布時被打碼
低成本采集數(shù)據(jù),爆款學(xué)術(shù)成果再升級
Memo 機器人背后,搭載的是 Sunday 的 ACT-1 模型。這款模型,通過公司自研的一款 Skill Capture Glove(技能捕捉手套)收集數(shù)據(jù)訓(xùn)練而來。
它也是 Sunday 這次披露的核心亮點。
![]()
*技能捕捉手套(左)與 Memo 機器人手(右)
目前具身領(lǐng)域公認(rèn)的一大瓶頸是數(shù)據(jù)。
于是趙子豪和遲宬這兩位“小天才”突發(fā)奇想:全球有80億人口,如果利用大家的日常動作采集數(shù)據(jù),就能打破數(shù)據(jù)僵局,快速構(gòu)建智能。
他們決定,打造這款單價約400美元、仿造 Memo 手部的手套,聘請遠程工作者佩戴著手套完成家務(wù)勞動,從而收集寶貴的真實數(shù)據(jù)給機器人使用。
“與遙操相比,手套使我們的資本效率提高了兩個數(shù)量級(200 美元 vs 20,000 美元)。”趙子豪在推特上說。
![]()
當(dāng)然這套方案中還有一個關(guān)鍵問題,就是人類和機器人形態(tài)不完全一樣。所以從人類身上捕獲的任何數(shù)據(jù),都要能轉(zhuǎn)化得和機器人操作出的數(shù)據(jù)一樣才有效。
而且,雖然手套可以調(diào)整雙手的位置,但不同人類采集者的身高、臂長各不相同,外貌也存在差異——攝像頭捕捉到的是人類手臂,而機器人需要從機器人手臂中學(xué)習(xí)。
*Memo 制作咖啡
針對這個問題,Sunday 又研發(fā)了Skill Transform 技術(shù)。
它能對原始觀測數(shù)據(jù)(包括運動學(xué)數(shù)據(jù)和視覺數(shù)據(jù))對齊,剔除人類特有的細節(jié)。這樣做之后,Sunday 能以90%的成功率將手套數(shù)據(jù)轉(zhuǎn)化為等效的機器人數(shù)據(jù),形成高保真訓(xùn)練集,外觀和動作與機器人自身生成的數(shù)據(jù)完全一致。
基于這種收集數(shù)據(jù)的思路,再加上一些其他 Tips——比如加入3D地圖和家庭布局?jǐn)?shù)據(jù)集訓(xùn)練,讓模型在新家庭快速適應(yīng)等等,他們做出了 ACT-1 模型。
*從餐桌到洗碗機的清理過程中,ACT-1自主完成了33個獨特動作、共計68次靈巧交互,涉及21種不同物體,同時導(dǎo)航距離超過130英尺(約40米)。
不難看出,數(shù)據(jù)采集思路是遲宬之前的核心項目 UMI 的升級版。
之前 UMI 手持夾爪搭配 GoPro 相機,就是一套大幅降低數(shù)據(jù)采集成本的方案,當(dāng)時讓行業(yè)里多家廠商迅速跟進,推出了工業(yè)化數(shù)采產(chǎn)品。
關(guān)于 ACT-1 模型,目前沒有更詳細的信息。官方只表示它是個全新的模型,和趙子豪之前的 ALOHA 沒什么關(guān)系。
![]()
*UMI方案
搭建這些基礎(chǔ)技術(shù),花費了兩位創(chuàng)始人超過一年的時間。之后,他們又花了三個月的時間讓機器人自主運行,有了今天我們看到的 Memo。
*Memo 制作咖啡的細節(jié)展示
Memo 發(fā)布之后,很多人認(rèn)為這款機器人的設(shè)計實用又優(yōu)雅,也為學(xué)術(shù)大佬把自己的項目真正落地而激動。
還有人對它表示了自己的擔(dān)憂。
官方給出的消息是,Memo 此刻處于“手搓版”階段,定價2萬美元。后續(xù)正式發(fā)售時,價格可能下調(diào)到當(dāng)前的一半。
但它的 Beta 版要到2026年晚些時候才會發(fā)布。現(xiàn)在節(jié)奏是,Sunday 會向外界開放 Family Beta 申請,入選的用戶不收費用,能直接和團隊一起打磨 Memo。
至于正式量產(chǎn),出于測試硬件等原因,要等到2027-2028年。
這樣的 Timeline 讓一些人覺得太慢了。
畢竟到那時,同行的落地進度可能已遠超預(yù)期,Sunday 通過數(shù)據(jù)和模型快速 scalable 的能力,不確定是否還奏效。
從很多程度上,具身一直都是速度的較量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.