蘇度科技昨日發(fā)布首篇技術(shù) Blog,正式展示了其軟硬件全棧自研的機(jī)器人系統(tǒng) Sudo R1,并宣布,截至2025年底,已獲得包括寧德、阿里、高瓴、國(guó)壽股權(quán)、綠洲、騰訊、螞蟻、IDG、藍(lán)馳、數(shù)字未來(lái)、孚騰、復(fù)旦科創(chuàng)、云暉等機(jī)構(gòu)的投資,同時(shí),公司已于近期完成新一輪融資,估值突破20億美元,并進(jìn)一步引入頭部產(chǎn)業(yè)客戶與全球一線投資機(jī)構(gòu),高鵠資本擔(dān)任長(zhǎng)期獨(dú)家財(cái)務(wù)顧問(wèn)。
Sudo R1采用3D世界模型與強(qiáng)化學(xué)習(xí)一體化設(shè)計(jì),在不使用任何真機(jī)數(shù)據(jù)的前提下,實(shí)現(xiàn)關(guān)鍵任務(wù)接近100%的 Zero-shot 成功率。這是業(yè)內(nèi)首次系統(tǒng)性驗(yàn)證:僅依賴仿真數(shù)據(jù)訓(xùn)練,即可支撐模型跨越現(xiàn)實(shí)世界復(fù)雜性。
面向通用操作的底層基礎(chǔ)模型蘇度所展示的并非單一任務(wù)優(yōu)化模型,而是一個(gè)面向通用操作的底層基礎(chǔ)模型。在 Zero-shot 條件下,該系統(tǒng)即可實(shí)現(xiàn)接近100%的成功率,并對(duì)未知環(huán)境與未見(jiàn)物體表現(xiàn)出穩(wěn)定的泛化能力,同時(shí)保持較高的動(dòng)作流暢性,具備“開箱即用”的能力體驗(yàn)。
以 Pi、Generalist 類模型為代表的技術(shù)路線,通常依賴 few-shot 方式進(jìn)行適配,即需要針對(duì)具體場(chǎng)景進(jìn)行示教,并在限定環(huán)境與物體條件下才能獲得較高成功率。一旦環(huán)境或物體發(fā)生變化,往往需要重新進(jìn)行數(shù)據(jù)采集與適配,本質(zhì)上更接近“任務(wù)級(jí)優(yōu)化”,而非“能力級(jí)泛化”。
如果類比大模型的發(fā)展路徑,蘇度更接近 ChatGPT 所代表的范式——通過(guò)通用底層能力解決任務(wù),而非針對(duì)每個(gè)場(chǎng)景單獨(dú)構(gòu)建系統(tǒng)。
![]()
在一段60分鐘不間斷、未經(jīng)剪輯的實(shí)測(cè)中,Sudo R1 在不同光照與背景條件下,對(duì)透明、反光、柔性、不規(guī)則形狀等多類未見(jiàn)物體,均實(shí)現(xiàn)接近100%的抓取成功率,并展現(xiàn)出強(qiáng)大的閉環(huán)實(shí)時(shí)控制與空間避障能力。更值得關(guān)注的是,該操控模型在訓(xùn)練過(guò)程中完全基于仿真數(shù)據(jù)構(gòu)建,未依賴任何真實(shí)世界采集數(shù)據(jù)。這一設(shè)定并非工程上的限制,而是一項(xiàng)刻意的技術(shù)驗(yàn)證——即在不借助真機(jī)數(shù)據(jù)對(duì)齊的前提下,檢驗(yàn)仿真預(yù)訓(xùn)練是否能夠獨(dú)立支撐模型跨越現(xiàn)實(shí)世界的不確定性。
突破具身發(fā)展瓶頸,破解數(shù)據(jù)供給核心難題這一結(jié)果之所以重要,是因?yàn)槠湔婊貞?yīng)了當(dāng)前行業(yè)的兩個(gè)核心瓶頸:
其一,數(shù)據(jù)規(guī)模瓶頸。當(dāng)前主流路徑依賴真機(jī)數(shù)據(jù)采集(從遙操作、UMI、再到人類視角采集等),盡管成本與效率上持續(xù)優(yōu)化,但規(guī)模化擴(kuò)展仍面臨經(jīng)濟(jì)性挑戰(zhàn),數(shù)據(jù)供給難以隨算力線性增長(zhǎng),并持續(xù)限制模型能力上限。
其二,物理世界建模不足。真實(shí)數(shù)據(jù)雖包含視覺(jué)與動(dòng)作信息,但對(duì)物理世界核心——dynamics(動(dòng)力學(xué))的刻畫往往間接且不完備,導(dǎo)致模型難以學(xué)習(xí)穩(wěn)定、可泛化的物理交互規(guī)律。這也是當(dāng)前多數(shù)具身系統(tǒng)在真實(shí)環(huán)境中表現(xiàn)不穩(wěn)定、難以規(guī)模化的根本原因之一,同時(shí)也是當(dāng)前真機(jī)路線較少正面解決的問(wèn)題。
在這一背景下,單純討論“真機(jī)數(shù)據(jù)與仿真數(shù)據(jù)孰優(yōu)孰劣”并無(wú)實(shí)際意義,更關(guān)鍵在于構(gòu)建一條可規(guī)模化的數(shù)據(jù)與模型協(xié)同路徑:仿真數(shù)據(jù)由于天然包含完整的物理交互信息且具備顯著的成本與規(guī)模優(yōu)勢(shì),更適合承擔(dān)“廣度與物理常識(shí)”的構(gòu)建;而真機(jī)數(shù)據(jù)則具備真實(shí)噪聲、傳感器誤差及復(fù)雜環(huán)境擾動(dòng)等特性,能夠提供與現(xiàn)實(shí)分布對(duì)齊的關(guān)鍵信號(hào),但其高成本決定了其更適合作為后期對(duì)齊與校正的稀缺資源。圍繞具體場(chǎng)景動(dòng)態(tài)確定兩者的配比,才是真正的長(zhǎng)期壁壘。
而這一配比能力的前提,是高保真仿真器和對(duì)數(shù)據(jù)協(xié)同機(jī)制的深度理解。
蘇度的數(shù)據(jù)體系建立在高保真仿真器之上,天然包含對(duì)物理 dynamics 的直接表達(dá),使模型能夠?qū)W習(xí)到可泛化的物理規(guī)律。這使其成為目前少數(shù)在世界模型和強(qiáng)化學(xué)習(xí)一體化路徑上驗(yàn)證最充分的團(tuán)隊(duì)。換言之,Sudo R1 所展示的,并非一次任務(wù)調(diào)參后的結(jié)果,而是其底層數(shù)據(jù)路線與模型架構(gòu)共同作用的外在體現(xiàn)。
Sudo R1 打破了行業(yè)長(zhǎng)期以來(lái)對(duì) Sim2Real 路徑的根本性質(zhì)疑。它不僅證明了這一路徑的可行性,更在泛化性、敏捷性、魯棒性和空間智能四個(gè)維度上同時(shí)逼近生產(chǎn)級(jí)水準(zhǔn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.