前段時(shí)間看到宇樹科技王興興提到:當(dāng)前的空間模型已經(jīng)可以生成接近真實(shí)的物理世界環(huán)境,這意味著機(jī)器人訓(xùn)練可以逐步從“真實(shí)數(shù)據(jù)采集”轉(zhuǎn)向“虛擬空間生成驅(qū)動(dòng)”,不再完全依賴現(xiàn)實(shí)拍攝數(shù)據(jù)。
但需要明確的是,這種能力目前仍存在邊界。
對(duì)于高復(fù)雜度動(dòng)作(如武術(shù)、舞蹈等),仍然依賴于高精度動(dòng)態(tài)捕捉系統(tǒng)來獲取數(shù)據(jù),空間模型暫時(shí)無(wú)法完全替代。而對(duì)于低復(fù)雜度、結(jié)構(gòu)化較強(qiáng)的任務(wù)(如家庭清潔、簡(jiǎn)單操作),空間模型已經(jīng)具備一定可用性。
如果目標(biāo)是訓(xùn)練具備復(fù)雜空間操作能力的人形機(jī)器人,從當(dāng)前的數(shù)據(jù)規(guī)模與技術(shù)成熟度來看,仍需要約5年的積累周期。期間雖然算力與存儲(chǔ)能力持續(xù)提升,但空間視頻與多模態(tài)數(shù)據(jù)的規(guī)模呈指數(shù)級(jí)增長(zhǎng),訓(xùn)練成本與數(shù)據(jù)管理壓力同步放大。
基于這一趨勢(shì),我判斷:未來5年,像 Vision Pro 這樣的MR設(shè)備將成為關(guān)鍵過渡形態(tài),其角色類似早期“小靈通”階段的通信設(shè)備——并非最終形態(tài),但具備重要的過渡價(jià)值。
當(dāng)前人形機(jī)器人整體仍處于這一“早期階段”,距離真正的智能體操作系統(tǒng)(Agent OS)仍有明顯差距。
在這一過渡期內(nèi),大量復(fù)雜任務(wù)仍需要依賴“人類 + MR設(shè)備”的方式完成,即通過空間交互由人類進(jìn)行操作引導(dǎo),逐步積累數(shù)據(jù)并反哺機(jī)器人能力演進(jìn)。
如下是人形機(jī)器人自主大模型的發(fā)展歷史階段
![]()
如下是MR眼鏡的發(fā)展模型階段
從現(xiàn)在的vision Pro類MR眼鏡再到逐步輕薄的框架眼鏡再到腦機(jī)接口與眼鏡融入的穿戴式設(shè)備。
![]()
帶著團(tuán)隊(duì)實(shí)現(xiàn)空間計(jì)算與人類空間記憶、空間視覺的打通
如下是Gemini3 通過VR眼鏡掃描環(huán)境實(shí)現(xiàn)的環(huán)境建模,再通過空間模型marble進(jìn)行重建,就得到了真實(shí)的環(huán)境重建。
![]()
![]()
![]()
而我們團(tuán)隊(duì)正在這個(gè)技術(shù)路線實(shí)現(xiàn),不同的是通過腦機(jī)接口來實(shí)現(xiàn)人類的記憶提取,而不僅是掃描捕捉現(xiàn)在的物理環(huán)境,而空間模型則是我們的底座,用來生成人類記憶中的空間場(chǎng)所。
因?yàn)槿祟惖挠洃浭强臻g化的,通過空間計(jì)算才能夠彌補(bǔ)這部分,是現(xiàn)在手機(jī)與電腦終端所不能實(shí)現(xiàn)的。
腦機(jī)接口就是MR眼鏡下一個(gè)手機(jī)
而相比于手機(jī),我認(rèn)為人類的下一個(gè)終端不僅是眼鏡,而是眼鏡與腦機(jī)接口的設(shè)備,只是現(xiàn)在腦機(jī)接口不管是非侵入式還是侵入式都過于龐大,以及對(duì)于用戶的要求較高(比如開顱),而未來勢(shì)必隨著芯片與供應(yīng)鏈工藝技術(shù)加強(qiáng),這部分始終會(huì)逐步變小,成為MR眼鏡的一部分
![]()
因?yàn)樵谂宕餮坨R的同時(shí),其實(shí)腦機(jī)接口也有天然的腦部區(qū)域的接觸區(qū),這部分有對(duì)應(yīng)的腦電通道信號(hào)采集,不過比較遺憾的是現(xiàn)在腦電信號(hào)要是存非侵入式的,勢(shì)必會(huì)有大量的噪音,所以半侵入式的腦機(jī)接口與MR眼鏡將是未來的最終效果,用戶仍然需要植入體內(nèi),只是不需要開顱,類似于打胰島素的小針頭一樣的
開發(fā)者生態(tài),產(chǎn)品經(jīng)理的空間APP
不過從現(xiàn)在來看,空間操作系統(tǒng)的應(yīng)用是可以走更多年的,甚至是走到腦機(jī)接口與MR眼鏡設(shè)備一起出現(xiàn)的時(shí)候,因?yàn)槿祟惖牟僮骶褪强臻g操作,通過眼球、手勢(shì)、甚至是肢體操作是在真實(shí)世界里的一比一還原。
沒有比這個(gè)交互更加還原與讓人類快速學(xué)習(xí)習(xí)慣的了。
所以現(xiàn)在我建議產(chǎn)品經(jīng)理盡快切換到vision Pro與AndroidXR開發(fā),當(dāng)然現(xiàn)在能夠買的終端設(shè)備只有apple vision Pro在國(guó)內(nèi),其他的設(shè)備都還不算空間設(shè)備,只能算一個(gè)AI眼鏡的顯示器版本,因?yàn)槔锩姹举|(zhì)上還是跑的手機(jī)操作系統(tǒng),而不是空間操作系統(tǒng)。
同時(shí)傳感器也沒有辦法讓人類最自然的交互眼球與手呈現(xiàn),因此開發(fā)的應(yīng)用與產(chǎn)品經(jīng)理的設(shè)計(jì)邏輯完全不一樣,到空間應(yīng)用之后還是要重新做。
空間交互的手勢(shì)操作
![]()
空間交互的眼球追蹤
![]()
空間交互的面部追蹤
![]()
空間交互的環(huán)境錨點(diǎn)與建模
![]()
只有以上幾個(gè)基本傳感器布局,才能夠說構(gòu)建一個(gè)空間應(yīng)用,而不是去做一個(gè)普通的手機(jī)APP在眼鏡上的版本(現(xiàn)在AI眼鏡廠商就是走的這個(gè)序列)。
今天的分享就到這里
題圖來自 Unsplash ,基于 CC0 協(xié)議, 如有侵權(quán),請(qǐng)聯(lián)系pmtalk123刪除
“分享產(chǎn)品經(jīng)理改變世界的點(diǎn)滴”
產(chǎn)品顧問| 產(chǎn)品咨詢|培訓(xùn)合作
請(qǐng)?zhí)砑游⑿?strong>PMxiaowanzi
最近我的原創(chuàng)
每日案例拆解庫(kù),AI等產(chǎn)品打卡群
我創(chuàng)建的產(chǎn)品設(shè)計(jì)打卡社群,加入后365天,每天體驗(yàn)一款A(yù)PP。提升產(chǎn)品設(shè)計(jì)能力,同時(shí)有1300份體驗(yàn)報(bào)告幫助你找到競(jìng)品
在這里你可以隨時(shí)查詢到你想找的各類競(jìng)品行業(yè)APP,無(wú)須自己親自下載就可以馬上得到APP的一手產(chǎn)品優(yōu)化、交互設(shè)計(jì)、功能描述信息。
從優(yōu)化&建議、商業(yè)模式、運(yùn)營(yíng)、功能描述、交互設(shè)計(jì)、產(chǎn)品定位至少6個(gè)維度,體驗(yàn)一款應(yīng)用。
平均1天1塊錢,掃碼購(gòu)買即可加入
連續(xù)體驗(yàn)48款應(yīng)用,通過后原路退回
報(bào)名后添加星球助理
PMTalk123
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.