文|邱曉芬
編輯|蘇建勛
CES 2026上,一家中國(guó)機(jī)器人公司的展臺(tái)外擠滿了人。大家圍觀的,不是CES上司空見(jiàn)慣的人形機(jī)器人或四足狗,而是一臺(tái)雙輪足、身軀四四方方、帶有顯示屏的機(jī)器人——只有15公斤重,40厘米高。
它在草皮上時(shí)不時(shí)抱著皮球行進(jìn),穩(wěn)穩(wěn)穿越不同狀態(tài)的地面。看到有觀眾拍攝它時(shí), 它會(huì)停下來(lái)與人互動(dòng),左右輕輕搖晃,并在屏幕上切換不同表情。仔細(xì)看,它上方還加裝了全景相機(jī),實(shí)時(shí)記錄下被圍觀的畫(huà)面。
這臺(tái)機(jī)器Rovar X3人出自「深庭紀(jì)」,主打戶外陪伴。
目前,這臺(tái)機(jī)器人尚未正式發(fā)售,但「深庭紀(jì)」的創(chuàng)始人王弢告訴《智能涌現(xiàn)》,未來(lái)的價(jià)格會(huì)低于5000美金,“可能會(huì)擊穿很多美國(guó)人對(duì)機(jī)器人品類的價(jià)格預(yù)期”。
![]()
△Rovar X3能踢球還能當(dāng)攝影支架
這種全新的機(jī)器人構(gòu)型,背后的設(shè)計(jì)者同樣大膽——「深庭紀(jì)」的創(chuàng)始人王弢,享受一切不確定性。
這種偏好,體現(xiàn)在他過(guò)去每一項(xiàng)關(guān)鍵的職業(yè)生涯抉擇中。2015年,在斯坦福攻讀深度學(xué)習(xí)和視覺(jué)感知博士的他,和導(dǎo)師吳恩達(dá)聯(lián)合創(chuàng)辦了專攻L4的自動(dòng)駕駛公司Drive AI。
在自動(dòng)駕駛沉浮的歲月里,這一公司最終迎來(lái)一個(gè)不錯(cuò)的歸宿——2019年,這家200人的硅谷明星公司被蘋(píng)果“招聘式收購(gòu)”,吸納進(jìn)蘋(píng)果的造車(chē)項(xiàng)目“泰坦”。
但王弢沒(méi)有像其他人一般加入蘋(píng)果。“不是蘋(píng)果不好,是我能看到十年后我在哪個(gè)位置,對(duì)于這種未來(lái),我很抗拒”,王弢直言。
最后,他選擇加入了小鵬。在時(shí)任自動(dòng)駕駛副總裁吳新宙麾下,王弢用三年時(shí)間,從0到1搭建了小鵬汽車(chē)的視覺(jué)感知團(tuán)隊(duì)。
不管是2015年進(jìn)入自動(dòng)駕駛領(lǐng)域,還是2024年離開(kāi)小鵬投身機(jī)器人創(chuàng)業(yè),王弢喜歡在賽道尚未收斂的時(shí)候,趟出一條路——不確定性的背后,恰恰藏著“十倍增長(zhǎng)”的紅利。
![]()
△王弢,圖源:受訪者提供
享受不確定性的背后,王弢性格的另一面是,務(wù)實(shí),關(guān)注落地。
在行業(yè)大講人形機(jī)器人干活的故事時(shí),王弢選擇先從戶外切入,并向家庭場(chǎng)景蜿蜒進(jìn)發(fā)。他將他們的戶外陪伴機(jī)器人Rovar X3,稱為最有機(jī)會(huì)進(jìn)入家庭的物理AI MVP(最小可行性產(chǎn)品)。
在硅谷生活了16年的王弢告訴我們,這種產(chǎn)品思路,源于他對(duì)身邊人的觀察。
在硅谷,當(dāng)全世界最聰明的一群人聚集在一起時(shí),最大的困擾是無(wú)聊,在當(dāng)?shù)赜小盀硡^(qū)三俗”的說(shuō)法——這群人在周末基本只做三件事:帶孩子戶外徒步、去野外摘櫻桃、看房子。
尋求戶外搭子,是這群硅谷人士的真實(shí)需求——在此前,大家的選擇只有兩個(gè),寵物狗,或者售價(jià)高達(dá)7.5萬(wàn)美元的波士頓動(dòng)力四足狗。
為此,王弢為Rovar X3設(shè)計(jì)了三大主要用途:
首先,它能充當(dāng)“戶外搭子”。其視覺(jué)系統(tǒng)通過(guò)識(shí)別主人的生物特征(人臉、步態(tài)、身形),緊緊跟隨主人。在相對(duì)復(fù)雜的戶外路面下不僅能靈活避障,還能 馱重物,整個(gè)過(guò)程不需要經(jīng)過(guò)遙控;
其次,它還可以在幫忙照看小孩,和小孩躲貓貓、幫忙撿球、和人類踢球等等;另外,你還可以把手機(jī)和全景相機(jī)支在上面,讓Rovar X3充當(dāng)拍攝支架。
![]()
△2026年CES上,Rovar X3和觀眾打招呼
在機(jī)器人領(lǐng)域創(chuàng)業(yè),王弢坦言,比曾經(jīng)的自動(dòng)駕駛領(lǐng)域,多了一份“造物”的興奮感——現(xiàn)在的機(jī)器人,已不是冷冰冰的自動(dòng)化設(shè)備,而是有自主性、有生命感的“物理AI”。
只是,現(xiàn)下“造物”的方向,五花八門(mén)。陪伴型機(jī)器人的產(chǎn)品形態(tài)明顯尚未收斂。而王弢對(duì)于這個(gè)品類的很多判斷,也和市面上的大多數(shù)人不一樣。
在Rovar X3的設(shè)計(jì)邏輯中,相較于“機(jī)器人會(huì)不會(huì)聊天”,他更強(qiáng)調(diào)“有沒(méi)有一起做過(guò)事”。讓機(jī)器人參與到真實(shí)世界的行動(dòng)中,與人協(xié)同完成任務(wù),長(zhǎng)久地陪伴才會(huì)發(fā)生。
這種啟發(fā),源于「深庭紀(jì)」公司的第九號(hào)員工——一只小狗。他觀察到,在午休時(shí)間,員工們會(huì)自發(fā)把小狗帶到草坪上,扔球、奔跑。現(xiàn)實(shí)世界里的互動(dòng),讓人和小狗建立了深刻的情感鏈接。
![]()
△Rovar X3能撿球
建立鏈接后,更進(jìn)一步的思考是:如何讓機(jī)器人智能體持續(xù)變強(qiáng)?
大多數(shù)人的選擇是,將機(jī)器人送進(jìn)工廠,或者鎖定在某一個(gè)細(xì)分的場(chǎng)景里,讓模型進(jìn)化。
王弢反而認(rèn)為,這種做法雖然能帶來(lái)交付,并不利于機(jī)器人智能體的提升——以工廠場(chǎng)景為例,特點(diǎn)是高度標(biāo)準(zhǔn)化,容錯(cuò)率低。
這意味著,能幫助模型進(jìn)化的不確定性因素、信息也隨之消失。而參考GPT,卻是在復(fù)雜多樣數(shù)據(jù)的加持下,才出現(xiàn)涌現(xiàn)時(shí)刻。
特斯拉是一個(gè)經(jīng)典案例。馬斯克一開(kāi)始并不是直接去礦山或者封閉園區(qū)落地,特斯拉的MVP是直接在高速上跑L2輔助領(lǐng)航。“當(dāng)時(shí)看起來(lái)并不是很fancy,但是它最早的使用場(chǎng)景,和最終FSD的場(chǎng)景,都是公共道路。數(shù)據(jù)的DOMAIN(范圍)是比較接近的”。
在王弢看來(lái),戶外陪伴場(chǎng)景,正是一個(gè)天然更貼近家庭的選項(xiàng),且兩者數(shù)據(jù)訴求也基本一致。因此,在初步取得用戶的信任之后,王弢還希望機(jī)器人進(jìn)一步逐漸走入庭院、家庭,收集用戶更多多樣化的數(shù)據(jù)。
而這些數(shù)據(jù),也將成為其訓(xùn)練操作模型的專有數(shù)據(jù),加深機(jī)器人對(duì)于世界的理解,逐漸形成“數(shù)據(jù)飛輪”。
近期,「深庭紀(jì)」完成了億元天使輪融資,由藍(lán)馳創(chuàng)投領(lǐng)投,粒子未來(lái)基金跟投。《智能涌現(xiàn)》與王弢聊了聊,關(guān)于他鮮少披露的過(guò)往、以及他對(duì)打造具身智能MVP的理解。
以下是交流實(shí)錄(略經(jīng)摘編)
職業(yè)選擇中,尋找“十倍增長(zhǎng)”
《智能涌現(xiàn)》:之前你跟著吳恩達(dá)一起創(chuàng)辦Drive.ai,這個(gè)項(xiàng)目被蘋(píng)果收購(gòu)后,你沒(méi)有加入泰坦那個(gè)項(xiàng)目里,反而是加入小鵬。當(dāng)時(shí)做出這種選擇的人,多嗎?
王弢:我是2009年在斯坦福大學(xué)讀碩士,做深度學(xué)習(xí)和視覺(jué)感知,后來(lái)跟著吳恩達(dá)讀博士。當(dāng)時(shí)自動(dòng)駕駛一下子火起來(lái)。吳恩達(dá)和他的太太、我們幾個(gè)師兄弟聯(lián)創(chuàng)一起創(chuàng)辦了Drive AI ,做L4 無(wú)人駕駛。
我是聯(lián)創(chuàng),也是工程與研發(fā)總監(jiān),負(fù)責(zé)PNC模塊,就是規(guī)劃與控制模塊、系統(tǒng)集成。Drive AI 是2019年被蘋(píng)果收購(gòu)。被收購(gòu)之后沒(méi)加入蘋(píng)果的人,說(shuō)實(shí)話不是很多,我當(dāng)時(shí)的選擇確實(shí)看起來(lái)有一點(diǎn)非主流。
《智能涌現(xiàn)》:不加入蘋(píng)果,你當(dāng)時(shí)怎么判斷的?
王弢:第一點(diǎn),對(duì)我來(lái)說(shuō),真正有吸引力的不是進(jìn)入一家已經(jīng)被證明的公司,而是去做一件還沒(méi)有標(biāo)準(zhǔn)答案的事。蘋(píng)果代表的是完成度,而我當(dāng)時(shí)更在意的是創(chuàng)造的過(guò)程。
第二點(diǎn),我當(dāng)時(shí)對(duì)L4自動(dòng)駕駛的判斷是,這是一個(gè)非常長(zhǎng)周期,可能很多年都看不到產(chǎn)品的賽道,作為一家創(chuàng)業(yè)公司,比較明智的選擇還是要去抱一個(gè)口袋很深的“金主爸爸”。
在技術(shù)上面,L4需要全局地優(yōu)化,感知、預(yù)測(cè)、規(guī)劃、后臺(tái)數(shù)據(jù)閉環(huán)、算力平臺(tái)都是強(qiáng)耦合的。
但是蘋(píng)果作為一家非常典型也很成功的公司,它的組織方塊、組織模式是非常模塊化的。我當(dāng)時(shí)看到蘋(píng)果的每個(gè)團(tuán)隊(duì)成員是把自己輸入、輸出的接口定義得很清楚,盡量減少耦合,這個(gè)很明顯是一個(gè)硬件公司的做法。
所以我當(dāng)時(shí)的判斷是,在蘋(píng)果做L4,會(huì)可能變成一個(gè)很難落地的科研項(xiàng)目。但我自己的風(fēng)格是,希望把東西做出來(lái),落到實(shí)地。
《智能涌現(xiàn)》:所以落地這件事情,對(duì)于你來(lái)說(shuō)非常重要。
王弢:是的。
![]()
△Rovar X3有不同的表情
《智能涌現(xiàn)》:你剛剛說(shuō)不希望進(jìn)入一家已經(jīng)被市場(chǎng)證明過(guò)的公司,為什么后面選擇加入小鵬?
王弢:我是吳新宙招進(jìn)去的。在小鵬的前三年我是從0到1搭建視覺(jué)感知團(tuán)隊(duì),負(fù)責(zé)模型訓(xùn)練、數(shù)據(jù)采集標(biāo)注、模型部署、工程化等。其實(shí)在小鵬相當(dāng)于是一次創(chuàng)業(yè)的經(jīng)歷。
2023年初,我判斷自動(dòng)駕駛的感知和AI 已經(jīng)比較收斂了,格局也已經(jīng)定了。我自己的職業(yè)規(guī)劃經(jīng)歷都是尋找10倍增長(zhǎng),我當(dāng)時(shí)的判斷就是,自動(dòng)駕駛其實(shí)已經(jīng)不是下一個(gè)十倍增長(zhǎng)了。
《智能涌現(xiàn)》:后來(lái)是發(fā)生了什么,讓你覺(jué)得創(chuàng)業(yè)的時(shí)機(jī)真正成熟了?
王弢:2023年,我在鵬行帶AI團(tuán)隊(duì)。一線的實(shí)踐當(dāng)中,我們看到很多這個(gè)領(lǐng)域長(zhǎng)期存在,但是被低估的很多問(wèn)題。
比如說(shuō),真實(shí)世界數(shù)據(jù)的采集成本、標(biāo)注成本很高,哪怕到今天還是存在;sim to real有巨大的鴻溝;硬件平臺(tái)為了追求極致運(yùn)動(dòng)性能,存在過(guò)度設(shè)計(jì)的問(wèn)題。我們當(dāng)時(shí)內(nèi)部也在非常頻繁討論,走路應(yīng)該用輪式底盤(pán)還是雙足?
這些問(wèn)題會(huì)導(dǎo)致系統(tǒng)復(fù)雜度指數(shù)級(jí)上升,拖慢智能化的迭代速度。我就慢慢開(kāi)始萌生了一個(gè)想法:如果我去解決這件問(wèn)題,我有充足的資源,我會(huì)怎么去解決?
這種思考慢慢的指向了一個(gè)判斷:真正要推動(dòng)具身智能向前,需要一些全新的產(chǎn)品路徑。
創(chuàng)業(yè)是一場(chǎng)持續(xù)的思考,不是一瞬間的靈感。我推演了一段時(shí)間,從鵬行出來(lái)是2024年1月,我4月份才成立新公司。我覺(jué)得具身肯定是下一個(gè)10年、10倍增長(zhǎng)的機(jī)會(huì)。但如果要重新定義一代機(jī)器人,機(jī)器人應(yīng)該是有自主性、有生命感、以AI為先的,而不是一個(gè)冷冰冰的自動(dòng)化設(shè)備。我當(dāng)時(shí)有一種造物的沖動(dòng)、興奮感,
《智能涌現(xiàn)》:推演的三個(gè)月,你在做什么?戶外這個(gè)方向是怎么思考出來(lái)的
王弢:機(jī)器人我把它分成四個(gè)大的板塊——移動(dòng)、操作、智能、導(dǎo)航。
我覺(jué)得移動(dòng)、操作、導(dǎo)航這三塊很多可以復(fù)用自動(dòng)駕駛能力。智能這一塊,我當(dāng)時(shí)判斷它處于比較早的階段,我當(dāng)時(shí)思考的是,如何讓智能體要持續(xù)地變強(qiáng)?
我們最終還是希望借鑒特斯拉或者小鵬數(shù)據(jù)飛輪的方法論。過(guò)去的經(jīng)驗(yàn)是,誰(shuí)能夠把數(shù)據(jù)飛輪跑起來(lái),誰(shuí)就能夠在具身智能趨勢(shì)里面成為贏家。
進(jìn)廠,對(duì)智能體訓(xùn)練不是好事
《智能涌現(xiàn)》:關(guān)于智能體要怎么去變強(qiáng),你是怎么推演的?
王弢:第一,需要找到一個(gè)MVP,一個(gè)真正能夠走入終局的場(chǎng)景。拿特斯拉來(lái)舉例,它一開(kāi)始并不是去礦山或者封閉園區(qū),它的 MVP 是在車(chē)上去跑 L2 輔助領(lǐng)航。
當(dāng)時(shí)這個(gè)技術(shù)并不是很fancy,只是在高速上做自適應(yīng)巡航和車(chē)道保持。但是它的實(shí)際使用的場(chǎng)景,跟最終FSD需要使用的場(chǎng)景,都是公共道路,數(shù)據(jù)的DOMAIN(范圍)是比較接近的。
我的判斷就是,如果機(jī)器人最終要達(dá)到像馬斯克說(shuō)的幾億臺(tái)甚至十幾億臺(tái),那一定是要走入家庭的。
雖然我們不是一開(kāi)始就走入到家庭,我一定要盡可能貼近家庭,獲取家庭用戶的信任、獲取家庭用戶的數(shù)據(jù)。 第二,我認(rèn)為機(jī)器人使用的場(chǎng)景一定是diverse(多樣)的,不是限定幾個(gè)垂域,不能在垂域里面去采數(shù)據(jù)。
《智能涌現(xiàn)》:但很多具身智能公司都在瘋狂找垂域場(chǎng)景,比如工廠,但是你的MVP是落在家庭和戶外。你們?cè)趺纯创@種分野?
王弢:我覺(jué)得在商業(yè)化上,Tob是不錯(cuò)的一個(gè)選擇。Tob最大的優(yōu)勢(shì)是需求很清晰,只要把場(chǎng)景限定好,機(jī)器人是有機(jī)會(huì)做到穩(wěn)定執(zhí)行和交付的。
Tob的場(chǎng)景里面,最重要的目標(biāo)是不出錯(cuò),為了達(dá)成這個(gè)目標(biāo),產(chǎn)線也會(huì)把環(huán)境標(biāo)準(zhǔn)化。
這意味著有很多不確定的行為或者因素會(huì)在場(chǎng)景里面消失。我覺(jué)得這對(duì)于智能體的訓(xùn)練來(lái)并不是一件好事。GPT是在所有的領(lǐng)域都有數(shù)據(jù)的情況下才能涌現(xiàn),不是只在少量的幾個(gè)垂域訓(xùn)模型。
《智能涌現(xiàn)》:你是怎么發(fā)現(xiàn)戶外場(chǎng)景有陪伴的需求?
王弢:大家都調(diào)侃灣區(qū)是高科技大農(nóng)村,全球最聰明的人聚集一起,但高性價(jià)比的放松娛樂(lè)活動(dòng)非常少。工程師、碼農(nóng)們周末最常見(jiàn)的活動(dòng)就是徒步、摘櫻桃還有看房子,我們叫“灣區(qū)三俗”。
我自己也是徒步大軍中的一員。但走多了你會(huì)發(fā)現(xiàn),風(fēng)景很美、也很無(wú)聊。這時(shí)候我都在想,如果能有一臺(tái)自主移動(dòng)的陪伴機(jī)器人隨行,它既能承擔(dān)5公斤的負(fù)重,幫忙背包,在露營(yíng)空地也能陪孩子做游戲,是非常有價(jià)值的。
這不是一個(gè)完全脫離生活的幻想,而是灣區(qū)人們的真實(shí)需求,特別是在科技行業(yè)的有孩人群。
《智能涌現(xiàn)》:那你們的機(jī)器人是怎么從戶外場(chǎng)景,一步步進(jìn)入家庭場(chǎng)景?
王弢:我們雖然是先切入戶外的場(chǎng)景,但未來(lái)我們一定會(huì)走入家庭。
家庭室內(nèi)的門(mén)檻非常高,任何一次失誤都會(huì)摧毀消費(fèi)者的互信。戶外是一個(gè)切入點(diǎn),它的付費(fèi)意愿高,試錯(cuò)成本是比較低的。在戶外哪怕是土坡上面摔了一下,其實(shí)只要自己能站起來(lái),問(wèn)題就不是很大。
其次,在戶外的場(chǎng)景,我們可以復(fù)用很多在自動(dòng)駕駛領(lǐng)域已經(jīng)相對(duì)成熟的方法論。在戶外自主移動(dòng),是在更加開(kāi)放的環(huán)境中實(shí)現(xiàn)自動(dòng)駕駛系統(tǒng)。在低速場(chǎng)景下和人的交互,又和新能源車(chē)艙內(nèi)的智能座艙智能有一定的相似性。
我和很多土生土長(zhǎng)的美國(guó)人去聊,美國(guó)的主流文化對(duì)于最先進(jìn)的科技,持有一種既好奇又謹(jǐn)慎的態(tài)度。比如你看終結(jié)者系列,他們對(duì)于人形機(jī)器人有比較大的疑慮。
我們第一步用Rovar這種雙輪足形態(tài),個(gè)子也不高,不會(huì)像人一樣跟你長(zhǎng)篇大論的,有比較可愛(ài)的表情,更容易切入到家庭中。其次,它的主要使用場(chǎng)景是在戶外,用戶對(duì)它的疑慮也會(huì)更小一些,通過(guò)這樣的一代產(chǎn)品,能夠獲得用戶的信任,未來(lái)可以走到室內(nèi)。
《智能涌現(xiàn)》:那后面的第二步、第三步,具體怎么走?
王弢:關(guān)于第二步、第三步,我們現(xiàn)在有很多的選擇。一個(gè)是在戶外做得更加重度、更硬核,我們會(huì)做一個(gè)客單價(jià)更高的產(chǎn)品。
第二就是從戶外慢慢走入庭院,再走入家庭內(nèi)部。我會(huì)鼓勵(lì)用戶利用機(jī)器人采集到更多的數(shù)據(jù),比如用戶在后院清理雜草、清理樹(shù)葉、丟垃圾的數(shù)據(jù)。
這些數(shù)據(jù)我都可以鼓勵(lì)用戶去上傳,最后變成我們訓(xùn)練操作模型的專有數(shù)據(jù)。這是用戶真正從場(chǎng)景中得到的,和數(shù)據(jù)采集工廠里的數(shù)據(jù)不同。
《智能涌現(xiàn)》:這些數(shù)據(jù)去反哺到模型之后,能讓機(jī)器人產(chǎn)生什么新的玩法?
王弢:從最簡(jiǎn)單的說(shuō)起,比如說(shuō)用戶指某一個(gè)方向說(shuō),“你幫我把那個(gè)罐子拿過(guò)來(lái)”時(shí),機(jī)器人需要先有對(duì)于世界的理解。我們希望未來(lái)機(jī)器人能夠理解用戶的指令,自己去執(zhí)行命令。這是可以通過(guò)模型學(xué)習(xí)的。
《智能涌現(xiàn)》:你們未來(lái)這兩個(gè)方向都會(huì)去兼顧?
王弢:我覺(jué)得在夠長(zhǎng)的時(shí)間維度里,這些都是可以做的選項(xiàng)。具身智能是一個(gè)10年的賽道,很多時(shí)候需要通過(guò)市場(chǎng)反饋來(lái)決定下一個(gè)發(fā)力點(diǎn)。大疆剛剛一開(kāi)始在做無(wú)人機(jī)的時(shí)候,他也沒(méi)有想到會(huì)變成飛行相機(jī)。
陪伴機(jī)器人,不應(yīng)該只聊天
《智能涌現(xiàn)》:你們剛創(chuàng)業(yè)的時(shí)候是四足,但現(xiàn)在變成了輪足。為什么有這種改變?
王弢:我覺(jué)得現(xiàn)在物理AI最優(yōu)的構(gòu)型,遠(yuǎn)遠(yuǎn)都沒(méi)有收斂。雖然大家都做人形機(jī)器人,但如果仔細(xì)去看,構(gòu)型都是不一樣的。
從四足到雙輪足的演進(jìn),是因?yàn)槲覀儺a(chǎn)品定義逐漸清晰,才做了一次系統(tǒng)收斂。雙輪足的電機(jī)數(shù)量首先比四足要少一半,系統(tǒng)復(fù)雜度的出錯(cuò)概率會(huì)低很多。雙輪足的運(yùn)動(dòng)方式是靠輪轂、電機(jī),運(yùn)動(dòng)的能效比足式要高很多。
《智能涌現(xiàn)》:陪伴,最重要的是什么?很多廠商更側(cè)重語(yǔ)言上的陪伴,但你們好像不是這么想。
王弢:人其實(shí)也可以跟我們的機(jī)器人說(shuō)話,通過(guò)手勢(shì)或者語(yǔ)音。不過(guò),我們不希望Rovar變成GPT聊天的工具。它可以輸出一些簡(jiǎn)單的詞匯來(lái)表達(dá)自己的情緒,但是他不會(huì)長(zhǎng)篇大論。
我覺(jué)得陪伴,最重要的是和用戶形成情感上的連接。這個(gè)連接來(lái)自于,在某一個(gè)場(chǎng)景中和用戶一起去完成一些事情,這是最長(zhǎng)效、最牢固的。 關(guān)于陪伴粘性的思考,啟發(fā)自我們公司的9號(hào)員工,也是一條小狗。我們養(yǎng)了一個(gè)寵物,體驗(yàn)一下小狗跟人之間是怎么樣建立連接。
我們發(fā)現(xiàn)中午午休的時(shí)候,我們的員工非常樂(lè)意帶著小狗去草地上面去玩球,把球丟出去,小狗會(huì)把球叼回來(lái)。
現(xiàn)實(shí)世界里非常簡(jiǎn)單的事情,但是大家都樂(lè)此不疲。我覺(jué)得陪伴產(chǎn)品,應(yīng)該去做一些力所能及的物理連接。
《智能涌現(xiàn)》:你曾說(shuō)你們的受眾可以歸納為“硅谷老男孩”,這群人有什么共性?
王弢:“硅谷老男孩”是一個(gè)統(tǒng)稱,更加細(xì)化的話,其實(shí)是幾個(gè)類別:
一個(gè)是企業(yè)主和公司高管,他們時(shí)間稀缺,愿意為高質(zhì)量的產(chǎn)品體驗(yàn)付費(fèi);
第二個(gè)是創(chuàng)意工作者,比如抖音短視頻制作者、好萊塢的人,他們對(duì)于新形態(tài)的產(chǎn)品、審美有很高的敏感度;
第三個(gè)就是醫(yī)生、律師這類高收入專業(yè)人士,他們的共性是,不會(huì)問(wèn)機(jī)器人是什么,更關(guān)心機(jī)器人能不能融入生活。他們中一部分人還是保留著探索的樂(lè)趣,有對(duì)少年感的向往。
我們做過(guò)一些審美取向的調(diào)研。“硅谷老男孩”們并不喜歡過(guò)度的科幻機(jī)甲風(fēng),產(chǎn)品必須好看,但又克制不浮夸。
《智能涌現(xiàn)》:你們的產(chǎn)品,具體有什么玩法?
王弢:我們有三個(gè)最大的使用場(chǎng)景。
一個(gè)是戶外的陪伴,你在山上走,它像一個(gè)小寵物一樣在走在前面,有簡(jiǎn)單的交互,讓我感覺(jué)到不那么孤獨(dú),也可以幫忙背個(gè)水、背個(gè)相機(jī)。
從心理學(xué)的角度去分析,人在戶外,特別是美國(guó)這種地廣人稀的地方,心理上需要去尋找安全港灣。這也是為什么很多人會(huì)帶著寵物狗出去徒步。
第二個(gè)場(chǎng)景是小孩陪護(hù),比如躲貓、追逐、嬉戲。現(xiàn)在很多陪伴類的產(chǎn)品側(cè)重對(duì)話式陪伴,但是據(jù)我的觀察,粘性相對(duì)比較低。
為什么大家對(duì)于把球踢進(jìn)門(mén)里這樣一件簡(jiǎn)單的事情,會(huì)有成癮,我自己踢球那么多年從來(lái)沒(méi)有膩。我覺(jué)得這也是物理世界一部分的魅力。
第三個(gè)功能是可以加裝各種配件,手機(jī)或者是全景相機(jī)。Rovar有大量想象空間,用戶會(huì)找到千奇百怪的玩法,我們希望早期有一個(gè)發(fā)散的過(guò)程。
《智能涌現(xiàn)》:如果從技術(shù)的層面去拆解,背后都包含了哪些核心技術(shù),有什么比較難的地方?
王弢:這背后的技術(shù)挑戰(zhàn)是,如何讓機(jī)器人做好社交導(dǎo)航,比如在步道上面能夠進(jìn)行避障,美國(guó)很多步道都不是鋪裝路面,而是泥土路或者沙石路。
其次,機(jī)器人在戶外要能夠持續(xù)識(shí)別到主人,不會(huì)被干擾,這首先考驗(yàn)我們的視覺(jué)能力。我們用了一個(gè)純視覺(jué)的解決方案,沒(méi)有去使用激光雷達(dá),機(jī)器人通過(guò)深度特征去感知人類,比如人臉的特征、步態(tài)、身形。
在戶外場(chǎng)景里,續(xù)航、重量、地形通過(guò)性其實(shí)是一個(gè)不可能三角,考驗(yàn)著我們做取舍和平衡的能力。
《智能涌現(xiàn)》:你們提出的端側(cè)“慢腦 + 快腦”AI架構(gòu),但是市面上大家用的是“大腦+小腦”。兩者有什么差異?
王弢:“大腦+小腦”架構(gòu)中,大腦負(fù)責(zé)思考、小腦負(fù)責(zé)運(yùn)動(dòng)控制。但我認(rèn)為這種劃分方式并不十分全面。
現(xiàn)實(shí)情況下,有許多思考過(guò)程需要極快的處理速度,大腦的運(yùn)行速度相對(duì)較慢,僅依賴大腦無(wú)法完成某些任務(wù)。同理,一些運(yùn)動(dòng)控制類操作,也并非單純由小腦就能實(shí)現(xiàn)。
所以,我們所提出端側(cè)的“慢腦+快腦”架構(gòu)——“慢腦”負(fù)責(zé)把事情想清楚,而“快腦”則負(fù)責(zé)快速反應(yīng)。
具體而言,“慢腦”處理那些無(wú)需毫秒級(jí)或亞秒級(jí)反應(yīng),但需要深入理解的事務(wù)。例如,自動(dòng)識(shí)別當(dāng)前所處環(huán)境是公園、家庭庭院、室內(nèi)還是公共道路;識(shí)別用戶及其偏好,如記住小孩和家長(zhǎng)的長(zhǎng)相。
“快腦”則進(jìn)行實(shí)時(shí)響應(yīng)。比如,當(dāng)聽(tīng)到用戶喊“你快回來(lái)”時(shí),立刻停止當(dāng)前任務(wù)并原路返回;當(dāng)與機(jī)器人進(jìn)行踢球時(shí),在每次與球觸碰后,機(jī)器人迅速判斷下一步與球的接觸方式。
快腦與慢腦,二者并行運(yùn)行、產(chǎn)生交互數(shù)據(jù)。慢腦會(huì)提前向快腦傳達(dá)大致的任務(wù)信息,快腦則在此基礎(chǔ)上,負(fù)責(zé)向控制規(guī)劃模塊傳達(dá)如何執(zhí)行當(dāng)前任務(wù)。
《智能涌現(xiàn)》:陪伴機(jī)器人這個(gè)賽道有同質(zhì)化的趨勢(shì),你覺(jué)得這個(gè)領(lǐng)域核心的競(jìng)爭(zhēng)力是什么?
王弢:陪伴這個(gè)賽道,產(chǎn)品形態(tài)是沒(méi)有收斂的。我覺(jué)得最核心的能力是持續(xù)的用戶洞察,和領(lǐng)先競(jìng)品一代的技術(shù)認(rèn)知。這兩個(gè)可能聽(tīng)起來(lái)稍微抽象,但是要做創(chuàng)新品類,這兩點(diǎn)是最重要的。
《智能涌現(xiàn)》:要保持和競(jìng)品有一代的差距,行動(dòng)上要怎么體現(xiàn)?
王弢:我覺(jué)得公司除了找PMF(產(chǎn)品和市場(chǎng)匹配度)之外,還需要找到PTF(團(tuán)隊(duì)和產(chǎn)品的匹配度)。我們團(tuán)隊(duì)在美國(guó)生活了很多年,在文化、場(chǎng)景的理解上,天生是有一些優(yōu)勢(shì)的,能夠站在用戶角度去思考產(chǎn)品的功能。
我更多的是從算法研發(fā)的角度,在現(xiàn)有的算法中,尋找高潛力的、還沒(méi)有被使用到產(chǎn)品上的新技術(shù),做出人無(wú)我有的體驗(yàn)。
比如說(shuō)踢球,市面上沒(méi)有任何一個(gè)機(jī)器人可以在草地上,像一條小狗一樣跟你玩球。
《智能涌現(xiàn)》:這兩年陪伴型的機(jī)器人密集爆發(fā),背后有什么因素推動(dòng)?
王弢:更多的就是物理 AI 概念的帶動(dòng)。之前大家說(shuō) AI 更多的是GPT,能夠跟你對(duì)話、幫你解題,停留在虛擬世界當(dāng)中。但是這一波首先是自動(dòng)駕駛的AI能力有溢出,自動(dòng)駕駛是一個(gè)物理AI非常初級(jí)的形態(tài)。
第二是硬件成本持續(xù)下降到有望走入家庭了。以前說(shuō)到北美機(jī)器狗,大家想到的都是Boston Dynamics(波士頓動(dòng)力),售價(jià)7.5萬(wàn)美元。
但是我們的產(chǎn)品能做到5000美金以下,會(huì)擊穿很多美國(guó)人對(duì)機(jī)器人品類的價(jià)格預(yù)期。
《智能涌現(xiàn)》:陪伴機(jī)器人可能在什么時(shí)候達(dá)成你預(yù)期的“十倍增長(zhǎng)”?
王弢:在我們的規(guī)劃當(dāng)中,26年、27年是我們探索MVP 的階段,在鴻溝的左側(cè),去找早期的種子用戶,持續(xù)尋找killer APP。
未來(lái)確切的時(shí)間點(diǎn),我可能沒(méi)辦法很好去判斷。你看馬斯克在2012年說(shuō),還有兩年就能實(shí)現(xiàn)全自動(dòng)駕駛,最后證明他的時(shí)間判斷基本上都是錯(cuò)的。
我自己的方法論就是,不會(huì)刻意從時(shí)間上面去做判斷,但是我會(huì)關(guān)注實(shí)際技術(shù)的進(jìn)展。
如果某一天具身智能的操作領(lǐng)域,大家都用同一個(gè)Benchmark(標(biāo)準(zhǔn)),那我判斷“Alex moment”到來(lái)的時(shí)間,可能不會(huì)大于兩年了。用自動(dòng)駕駛來(lái)比喻的話,現(xiàn)在是在自動(dòng)駕駛2012、2013年的階段。
《智能涌現(xiàn)》:你覺(jué)得陪伴型機(jī)器人的PMF已經(jīng)找到了嗎?
王弢:我覺(jué)得初步是找到了,但是如果真的要形成爆款,我覺(jué)得可能還需要一定時(shí)間的用戶洞察。我們?cè)诿绹?guó)其實(shí)做了很多用戶調(diào)研,初步找到一波種子用戶。
但是種子用戶和大眾用戶之間的鴻溝怎么跨過(guò)去,如何尋找到更精準(zhǔn)的PMF,對(duì)于新品類來(lái)說(shuō)是比較挑戰(zhàn)的。
但是一旦這個(gè)鴻溝跨過(guò)去,作為新品類的定義者,也能收獲到巨大的紅利。
封面來(lái)源|受訪者提供
end
end
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.