![]()
![]()
提出以人為中心的ACE研究范式,連發(fā)多款重磅新品。
作者 | 許麗思
編輯 | 漠影
一家成立不到半年的具身智能創(chuàng)企,在產(chǎn)品正式對(duì)外發(fā)布前就默默攢了個(gè)神仙局,吸引了智元機(jī)器人、沐曦股份、中科曙光、本末科技、鹿明機(jī)器人、RoboScience、RoboParty等涵蓋機(jī)器人產(chǎn)業(yè)鏈多個(gè)環(huán)節(jié)的頭部玩家,齊齊為其背書打call。它到底是什么來頭?
這家公司就是大曉機(jī)器人。這場(chǎng)行業(yè)聚首,也傳遞出一個(gè)鮮明信號(hào):在通往通用機(jī)器人的漫長(zhǎng)道路上,中國(guó)機(jī)器人企業(yè)不是單打獨(dú)斗,而是選擇“在一起”。
回看過去一年,部分具身企業(yè)在融資、產(chǎn)品、訂單上一路狂飆,有時(shí)候會(huì)讓外界形成“具身智能第一梯隊(duì)已定、頭部格局已完成”的直觀判斷。但具身智能的牌桌,真坐滿了嗎?
大曉機(jī)器人董事長(zhǎng)王曉剛的回答很直接:頭部卡位還沒有完成,這個(gè)領(lǐng)域還遠(yuǎn)未成熟。在他看來,首先,機(jī)器人原有的技術(shù)路線仍有明顯缺陷,視覺為主的方案并非終局;其次,規(guī)模化場(chǎng)景尚未跑通,現(xiàn)在的機(jī)器人要么是提供情緒價(jià)值的表演性質(zhì)產(chǎn)品,要么是作為科研平臺(tái)存在;最后,產(chǎn)業(yè)鏈分工與成本控制、可靠性仍處早期,從零部件、傳感器到計(jì)算芯片等環(huán)節(jié),都存在很大的垂直整合空間。
具身智能的不確定性中蘊(yùn)含著巨大的機(jī)會(huì),一旦研究范式與技術(shù)路線發(fā)生重大轉(zhuǎn)變,前期積累可能會(huì)被快速顛覆,產(chǎn)業(yè)格局也將被重新洗牌。
大曉機(jī)器人選擇在這個(gè)時(shí)候入局,正是因?yàn)榭吹搅艘粋€(gè)全新的研究范式,即以人為中心的ACE研究范式。
12月18日,大曉機(jī)器人發(fā)布多款重磅新品:首個(gè)開源且商業(yè)應(yīng)用的開悟世界模型3.0(Kairos 3.0),開發(fā)者只需輸入簡(jiǎn)單指令,就能快速生成可視化的任務(wù)模擬內(nèi)容;具身超級(jí)大腦模組A1,讓機(jī)器狗能自主識(shí)別紅綠燈過馬路,能幫人看護(hù)孩童、提醒路人不要亂丟垃圾,甚至還能識(shí)別違停車輛、記錄車牌。
01.
港中文同門室友攜手,
入場(chǎng)自帶深厚技術(shù)和落地經(jīng)驗(yàn)
大曉機(jī)器人并非白手起家的公司,更像是一次帶著資源入場(chǎng)的再創(chuàng)業(yè)。其核心團(tuán)隊(duì),不僅有著十余年技術(shù)積累,也有產(chǎn)業(yè)級(jí)客戶與渠道資源的沉淀。
王曉剛作為商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事,曾負(fù)責(zé)過手機(jī)、互聯(lián)網(wǎng)、汽車等多條業(yè)務(wù)線,對(duì)商湯的研發(fā)體系非常熟悉,能夠很好地推動(dòng)商湯與大曉機(jī)器人的業(yè)務(wù)形成聯(lián)動(dòng),將商湯在渠道、客戶、垂直應(yīng)用開發(fā)等方面的優(yōu)勢(shì)遷移到大曉機(jī)器人上,幫助其快速實(shí)現(xiàn)場(chǎng)景的規(guī)模化落地。
目前,他主要負(fù)責(zé)大曉機(jī)器人整體戰(zhàn)略規(guī)劃與商業(yè)落地,同時(shí)推動(dòng)優(yōu)秀研究成果的產(chǎn)業(yè)化、工程化轉(zhuǎn)化。
![]()
▲商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、大曉機(jī)器人董事長(zhǎng)王曉剛
大曉機(jī)器人首席科學(xué)家陶大程兼具頂尖學(xué)術(shù)造詣與深厚產(chǎn)業(yè)實(shí)踐積淀。作為澳大利亞科學(xué)院院士,他榮獲IEEE計(jì)算機(jī)學(xué)會(huì)技術(shù)成就獎(jiǎng);同時(shí),他曾出任京東探索研究院創(chuàng)始院長(zhǎng)、優(yōu)必選人工智能首席科學(xué)家,深度參與科技企業(yè)的技術(shù)戰(zhàn)略布局與產(chǎn)品落地實(shí)踐。他在大曉承擔(dān)“持續(xù)研究創(chuàng)新”的牽引角色,主要負(fù)責(zé)帶領(lǐng)教授團(tuán)隊(duì)聚焦具身智能方向的創(chuàng)新。
而王曉剛和陶大程憑借深厚的AI學(xué)術(shù)積累,被評(píng)為全球華人科學(xué)家TOP5。此外,大曉機(jī)器人還匯集了多位來自南洋理工大學(xué)、香港大學(xué)和香港中文大學(xué)的AI科學(xué)家——呂健勤、李鴻升、劉子緯、潘新鋼、趙恒爽、劉希慧,他們既是環(huán)境智能、世界模型、具身基礎(chǔ)模型等垂直領(lǐng)域的開拓者,也是全球頂尖AI實(shí)驗(yàn)室MMLab的核心成員。其中多位核心成員是陶大程、王曉剛的學(xué)生,團(tuán)隊(duì)合作默契。
“互信”是大曉機(jī)器人創(chuàng)始團(tuán)隊(duì)的底色:首席科學(xué)家陶大程與董事長(zhǎng)王曉剛在香港中文大學(xué)求學(xué)期間,都師從湯曉鷗,其他教授都與MMLab有著深厚淵源,建立了深厚的互信基礎(chǔ)。
![]()
▲從左往右:潘新鋼、李鴻升、陶大程、王曉鋼、呂健勤、劉子緯、趙恒爽
更重要的是,大曉的團(tuán)隊(duì)是“教授團(tuán)隊(duì)+產(chǎn)業(yè)專家”的組合邏輯,匯集了來自AI、互聯(lián)網(wǎng)、機(jī)器人、智能駕駛等領(lǐng)域、擁有十余年行業(yè)實(shí)戰(zhàn)經(jīng)驗(yàn)的頂尖產(chǎn)業(yè)專家,親歷過從技術(shù)原型到規(guī)模化商用的全鏈路過程,能夠推動(dòng)具身智能從技術(shù)前沿到產(chǎn)業(yè)落地。
02.
從“以機(jī)器人為中心”到“以人為中心”,
最早提出環(huán)境式采集
在王曉剛看來,傳統(tǒng)具身智能發(fā)展存在短板,是因?yàn)樗捎玫氖?strong>“以機(jī)器為中心”的路線。該路線先設(shè)計(jì)形態(tài)、參數(shù)差異巨大的各類機(jī)器人本體,再通過本體采集數(shù)據(jù)訓(xùn)練通用模型,本質(zhì)上是用極高的資源消耗,換取有限且僵化的“智能”。
因此,大曉機(jī)器人率先提出“以人為中心(Human-centric)”的ACE具身研發(fā)范式,將人類與物理世界的互動(dòng)規(guī)律作為核心研究起點(diǎn),構(gòu)建了一套從“環(huán)境式數(shù)據(jù)采集—開悟世界模型3.0—具身交互”的全鏈路技術(shù)體系。
![]()
ACE范式核心技術(shù)之一,就是環(huán)境式數(shù)據(jù)采集技術(shù)。
今年8月前后,特斯拉、Figure AI等頭部企業(yè),都從真機(jī)遙操轉(zhuǎn)向以視覺為基礎(chǔ)的數(shù)據(jù)采集技術(shù)路線,但并未涵蓋力、觸覺、摩擦力等關(guān)鍵維度。世界模型是圍繞人與所接觸的世界、所處的環(huán)境展開,要對(duì)此進(jìn)行建模,就涉及視覺之外的更多維度。
所以,大曉機(jī)器人的環(huán)境式采集,并非單純局限于視覺模態(tài),而是整合第一視角與第三視角視頻、力觸覺信息、運(yùn)動(dòng)軌跡、語音等多模態(tài)數(shù)據(jù),構(gòu)建基于物理基礎(chǔ)的3D資產(chǎn)庫,覆蓋具身模型訓(xùn)練所需的各類交互信息。
在數(shù)據(jù)處理環(huán)節(jié),通過時(shí)序一致性對(duì)齊、交互動(dòng)態(tài)軌跡預(yù)測(cè)建模與物理正確性仿真校正,將采集到的“人—物—場(chǎng)”信息轉(zhuǎn)化為可直接用于模型訓(xùn)練的動(dòng)態(tài)場(chǎng)景數(shù)據(jù),實(shí)現(xiàn)從數(shù)據(jù)采集到應(yīng)用的全鏈路打通。
![]()
這種技術(shù)路徑,不僅數(shù)據(jù)維度更全面、任務(wù)覆蓋更長(zhǎng)程,而且交互精度更高,采集效率更具規(guī)模化,能快速完成從十萬小時(shí)到千萬小時(shí)的海量數(shù)據(jù)積累。
![]()
該技術(shù)已在實(shí)踐中進(jìn)行驗(yàn)證:在即時(shí)零售倉儲(chǔ)場(chǎng)景中,其已實(shí)現(xiàn)多視角數(shù)據(jù)采集,覆蓋數(shù)萬種 SKU,完成倉儲(chǔ)分揀與打包全流程,涵蓋五大階段13個(gè)原子動(dòng)作;在居家、零售等多元場(chǎng)景中,也已實(shí)現(xiàn)對(duì)人體自然行為、物品交互軌跡的精準(zhǔn)捕捉,甚至能復(fù)現(xiàn)遙操作范式下難以實(shí)現(xiàn)的生鮮抓取、精細(xì)化放置等任務(wù)。
03.
推出開源世界模型,
開啟物理世界的“DeepSeek時(shí)刻”
想要在具身智能的牌桌上改寫格局,大曉機(jī)器人最堅(jiān)實(shí)的底氣在于軟件、硬件上的產(chǎn)品力。
以環(huán)境式采集數(shù)據(jù)為基礎(chǔ),大曉機(jī)器人發(fā)布了首個(gè)開源且商業(yè)化應(yīng)用的世界模型——“開悟”世界模型(Kairos 3.0),內(nèi)置11大類、54細(xì)類,累計(jì)328個(gè)標(biāo)簽,覆蓋115個(gè)垂類具身場(chǎng)景,開發(fā)者只需輸入簡(jiǎn)單指令,就能快速生成可視化的任務(wù)模擬內(nèi)容,并可一鍵分享。
“開悟”采用“多模態(tài)理解-生成-預(yù)測(cè)”的一體化架構(gòu):
![]()
多模態(tài)理解:通過視覺、3D 軌跡、觸覺、摩擦力等多維度信息輸入,深度理解真實(shí)世界的物理規(guī)律與人類行為的底層邏輯。
![]()
生成: 基于多模態(tài)信息的深度融合,模型可生成長(zhǎng)時(shí)動(dòng)態(tài)交互場(chǎng)景視頻,在場(chǎng)景內(nèi)實(shí)現(xiàn)各元素精準(zhǔn)可控;并具備跨本體一鍵生成、多本體泛化、預(yù)測(cè)萬千演化路徑等特性,為具身智能提供高保真、可泛化的虛擬訓(xùn)練環(huán)境。
![]()
預(yù)測(cè):根據(jù)所選機(jī)器人本體、觀察到的圖像及視頻狀態(tài),可預(yù)測(cè)機(jī)器人后續(xù)動(dòng)作。
大曉機(jī)器人也高度重視開源模型社區(qū)的建設(shè),把世界模型變成行業(yè)可調(diào)用的基礎(chǔ)設(shè)施。其已向全行業(yè)開放API,讓所有企業(yè)都可以使用“開悟”世界模型工具鏈,推動(dòng)各類具身智能產(chǎn)品快速涌現(xiàn)。
另外,“開悟”已與沐曦股份、壁仞科技、中科曙光等多款廠商國(guó)產(chǎn)芯片完成適配,極大提升了芯片性能。
就像DeepSeek的出現(xiàn)改寫了大模型應(yīng)用生態(tài)的格局,“開悟”的出現(xiàn),有望開啟物理世界的“DeepSeek時(shí)刻”,構(gòu)建國(guó)產(chǎn)芯片與空間智能的新生態(tài)。
04.
給機(jī)器人造超級(jí)大腦,
快速部署安防、交通、文旅等場(chǎng)景
大曉機(jī)器人發(fā)布了具身超級(jí)大腦模組A1,搭載首創(chuàng)純視覺無圖端到端VLA具身智能模型,提升了機(jī)器狗復(fù)雜陌生環(huán)境中的適應(yīng)能力、交互能力等,能夠在多個(gè)場(chǎng)景下快速部署。
A1具備云端交互能力,依托云端模型平臺(tái),能實(shí)時(shí)解析自然語言指令與圖像語義的意圖關(guān)系,讓機(jī)器狗先理解要做什么,再生成可執(zhí)行的中間指令,最后交由底層控制器執(zhí)行。這樣,機(jī)器狗不僅能在復(fù)雜環(huán)境中自主巡檢、跟隨、避障,還能按自然語言指令更準(zhǔn)確地完成任務(wù)。
![]()
具體來說,A1讓機(jī)器狗無需預(yù)采高精地圖,就可以自主規(guī)劃導(dǎo)航路徑,自如穿梭在城市街道、天橋、臺(tái)階、人來人往的小區(qū)路口等多種復(fù)雜真實(shí)環(huán)境。


在這個(gè)過程中,機(jī)器狗能夠自主識(shí)別紅綠燈,明白什么時(shí)候過馬路;也能準(zhǔn)確識(shí)別前方障礙物,精準(zhǔn)避開。


在發(fā)現(xiàn)有人隨地丟棄垃圾時(shí),機(jī)器狗會(huì)主動(dòng)提醒“公共場(chǎng)合,請(qǐng)不要亂丟垃圾”;發(fā)現(xiàn)兒童靠近水池區(qū)域時(shí),會(huì)提醒“水池危險(xiǎn),請(qǐng)勿靠近”;同時(shí)還能識(shí)別違停車輛,記錄車牌并上傳云端,展現(xiàn)出多場(chǎng)景適配的綜合能力。



基于以上優(yōu)勢(shì),具身超級(jí)大腦模組A1在安防、能源、交通、文旅等對(duì)設(shè)備可靠性要求極高的場(chǎng)景中,可實(shí)現(xiàn)長(zhǎng)期穩(wěn)定工作。
王曉剛透露,大曉機(jī)器人在世界模型、具身大模型及數(shù)據(jù)服務(wù)領(lǐng)域已獲得部分訂單;未來重點(diǎn)推出的軟硬一體產(chǎn)品,預(yù)計(jì)明年能實(shí)現(xiàn)大規(guī)模落地。打造能針對(duì)性解決各種實(shí)際問題的軟硬一體的產(chǎn)品,是大曉的終極目標(biāo)。
發(fā)布會(huì)現(xiàn)場(chǎng),大曉機(jī)器人還宣布與智元機(jī)器人、銀河通用、沐曦、壁仞科技、中科曙光、Insta360、臥龍電驅(qū)等具身廠商、硬件、芯片、云服務(wù)、數(shù)據(jù)廠商等多領(lǐng)域伙伴達(dá)成戰(zhàn)略合作,共建“模型—硬件—場(chǎng)景”的一體化生態(tài),來縮短技術(shù)轉(zhuǎn)化鏈路。
05.
結(jié)語:具身智能終局,
在于構(gòu)建可持續(xù)進(jìn)化的機(jī)器智能
具身智能的競(jìng)爭(zhēng),從來不是單點(diǎn)技術(shù)的比拼,而是生態(tài)與落地能力的系統(tǒng)較量。
當(dāng)行業(yè)從實(shí)驗(yàn)室走進(jìn)現(xiàn)實(shí),誰能真正突破機(jī)器人與物理世界的交互天花板、破解規(guī)模化落地的成本與可靠性瓶頸、構(gòu)建可持續(xù)進(jìn)化的機(jī)器智能,誰才能在具身智能的激烈競(jìng)爭(zhēng)中站穩(wěn)腳跟。
大曉機(jī)器人從“以人為中心”的技術(shù)路徑切入,攜手產(chǎn)業(yè)鏈伙伴共建技術(shù)到場(chǎng)景的全鏈條,正是在嘗試回答這個(gè)問題,也或?qū)⒊蔀橥苿?dòng)行業(yè)范式遷移的關(guān)鍵變量。
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.