<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      GAIR 2025 「數(shù)據(jù)&一腦多形」分論壇,激辯 AI 演進路徑

      0
      分享至



      過去十年,AI的核心突破是從專用走向通用的語言理解;未來十年的關(guān)鍵戰(zhàn)役,或許就是將這種通用性,從語言世界拓展到物理世界。

      作者丨吳彤 劉欣 齊鋮湧 梁丙鑒

      編輯丨林覺民 馬曉寧


      在12月13日舉行的第八屆GAIR全球人工智能與機器人大會“數(shù)據(jù)&一腦多形”分論壇上,兩個看似獨立卻緊密交織的技術(shù)前沿——數(shù)據(jù)的價值重構(gòu)與一腦多形(One Brain, Many Forms)的架構(gòu)革命,成為探索下一代智能系統(tǒng)的核心焦點。

      一方面,數(shù)據(jù)正從傳統(tǒng)的“資源”角色,向更本質(zhì)的“認知基礎(chǔ)”與“價值載體”演進。

      隨著多模態(tài)大模型的爆發(fā),高質(zhì)量、結(jié)構(gòu)化、富有邏輯鏈的數(shù)據(jù)已不再是模型的“養(yǎng)料”那么簡單,它正演化為定義模型認知邊界與價值對齊的核心框架。

      本次論壇深入探討了如何在數(shù)據(jù)洪流中構(gòu)建更具解釋性、可信度與進化能力的知識體系,以及如何通過數(shù)據(jù)流動重塑產(chǎn)業(yè)智能化的閉環(huán)。數(shù)據(jù)不再僅僅是起點,更是驅(qū)動智能持續(xù)進化、與人和社會和諧共生的核心紐帶。

      另一方面,“一腦多形”的范式正在重新定義智能的構(gòu)建方式。

      它超越了單一模型解決特定任務(wù)的局限,指向一個更具適應(yīng)性與擴展性的未來:一個統(tǒng)一的底層認知核心(“一腦”),能夠動態(tài)衍生出適應(yīng)不同場景、模態(tài)與任務(wù)的多種形態(tài)。這不僅是架構(gòu)效率的革命,更是智能向通用性與自主性邁進的關(guān)鍵一步。

      論壇聚焦于如何讓同一個“大腦”理解語言、解析視覺、操控實體,并在不同形態(tài)間共享知識、遷移能力,最終實現(xiàn)從“專用智能”到“統(tǒng)一智能”的躍遷。

      兩者的融合,恰恰勾勒出通往更高級人工智能的路徑:以革新性的數(shù)據(jù)方法論,滋養(yǎng)和約束一個具有統(tǒng)一認知且形態(tài)多樣的智能核心。

      這不僅是技術(shù)的耦合,更是對智能本質(zhì)的深度思考——如何讓機器在理解復(fù)雜世界的同時,也能靈活、可靠地服務(wù)于這個世界的無限場景。因此,本次分論壇的討論,正是這一宏大征程的重要注腳。

      01

      新數(shù)據(jù)范式:驅(qū)動模型演進的核心基礎(chǔ)設(shè)施

      諾亦騰機器人創(chuàng)始人&CEO戴若犁:用動作捕捉技術(shù)構(gòu)建具身智能數(shù)據(jù)工廠


      在下午的“數(shù)據(jù) & 一腦多形”專場中,首場分享由諾亦騰機器人(Noitom Robotics)創(chuàng)始人/CEO 戴若犁博士帶來,主題為《用動作捕捉技術(shù)構(gòu)建具身智能數(shù)據(jù)工廠》。

      深耕動作捕捉與運動相關(guān)技術(shù)研究十余年,戴若犁博士在分享中回顧了自己對技術(shù)路徑與產(chǎn)業(yè)方向的長期思考,并指出,人形機器人所代表的具身智能,正在成為一個天花板足夠高、且對高質(zhì)量數(shù)據(jù)有強烈需求的新賽道。

      他提到,隨著人形機器人和具身智能研究逐步進入工程化階段,行業(yè)對高質(zhì)量、大規(guī)模數(shù)據(jù)的關(guān)注度顯著提升,越來越多的企業(yè)開始系統(tǒng)性地思考數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量與模型能力之間的關(guān)系。

      在談到數(shù)據(jù)商業(yè)模式時,戴若犁博士強調(diào),不同領(lǐng)域的數(shù)據(jù)生產(chǎn)邏輯存在本質(zhì)差異。具身智能對數(shù)據(jù)的獲取方式、結(jié)構(gòu)形式以及可遷移性提出了更高要求,這也決定了如果甲方獲取生數(shù)據(jù)的能力和乙方平權(quán),那這個領(lǐng)域的毛利天花板注定是可觀的。

      在案例分享環(huán)節(jié),他介紹了與西湖機器人在全身遙操作(whole-body teleoperation)方向上的合作實踐,戴博團隊提供的動作捕捉設(shè)備為相關(guān)研究提供了技術(shù)支持,貢獻了一份自己的力量。

      同時,戴若犁博士也從工程實踐出發(fā),客觀分析了遙操作作為數(shù)據(jù)獲取手段所面臨的三大結(jié)構(gòu)性挑戰(zhàn)(“原罪”),包括:

      • 成本效率:昂貴而緩慢,成功率很低。

      • 能力局限性:比如靈巧性高的手內(nèi)的操作(in-hand manipulation)、高精度依賴力觸覺的雙手協(xié)同、非視覺引導(dǎo)操作(vision non-guided manipulation)無法執(zhí)行,只有pick and place最成熟。

      • 以及跨本體泛化能力等問題。

      這些現(xiàn)實痛點,正推動行業(yè)進一步探索更加通用、可擴展的數(shù)據(jù)獲取范式。24年7月份,全球包括戴博團隊在內(nèi)的五個組都開始探索“如何讓數(shù)據(jù)能夠跨本體”。

      正是在這樣的背景下,行業(yè)開始將視角逐步拓展至以人為中心(human-centric)的數(shù)據(jù)路徑,嘗試構(gòu)建不與單一機器人本體強綁定的數(shù)據(jù)體系,從而提升數(shù)據(jù)在不同形態(tài)、不同平臺之間的復(fù)用價值。

      圍繞這一思路,戴若犁博士介紹了諾亦騰機器人(Noitom Robotics)建設(shè)具身智能數(shù)據(jù)工廠的實踐經(jīng)驗。相關(guān)數(shù)據(jù)采集工作覆蓋標(biāo)準(zhǔn)化采集與真實場景采集等多種形式,并在持續(xù)迭代中不斷優(yōu)化數(shù)據(jù)結(jié)構(gòu)與生產(chǎn)流程。

      分享中,他還展示了具身智能數(shù)據(jù)的“數(shù)據(jù)金字塔”框架,并提出:在設(shè)計不同層級的數(shù)據(jù)獲取方案時,理解每一層數(shù)據(jù)的“第一性問題”至關(guān)重要,只有明確數(shù)據(jù)的核心價值,才能在工程和商業(yè)層面形成可持續(xù)的路徑。

      演講最后,戴若犁博士引用Sergey Levine的學(xué)界作結(jié),以形象的“勺叉”比喻強調(diào)技術(shù)與產(chǎn)品取舍的重要性:與其追求“什么都能做”,不如聚焦于真正關(guān)鍵、能夠解決核心問題的能力,從而在復(fù)雜系統(tǒng)中構(gòu)建清晰而有效的價值。“如果你像麥當(dāng)勞里的勺叉,不僅在喝湯的時候會漏,還叉不起來雞塊。既要又要的結(jié)果就是個勺叉,咱不當(dāng)勺叉,咱們當(dāng)一個好用的叉子就行。”

      極數(shù)迭代CEO,深圳AIRS訪問研究員佟顯喬:具身智能的數(shù)據(jù)工程解決方案思考


      接下來分享的是極數(shù)迭代 CEO、深圳 AIRS 訪問研究員佟顯喬,他的分享主題是《具身智能的數(shù)據(jù)工程解決方案思考》。在該領(lǐng)域,佟顯喬積累了大量一線經(jīng)驗。

      一開場,他率先拋出觀點:無論具身模型如何演進,數(shù)據(jù)始終是基石。他預(yù)測,未來幾年具身數(shù)據(jù)體量將爆發(fā)式增長,“具身數(shù)據(jù)服務(wù)”會成為機器人賽道里下一個“Scale AI”級別的確定性機會。

      結(jié)合過往實踐,佟顯喬梳理出當(dāng)前幾大數(shù)據(jù)瓶頸:機器人泛化能力差,與數(shù)據(jù)量呈冪律關(guān)系——現(xiàn)有數(shù)據(jù)遠不能達到較高成功率;大規(guī)模、高質(zhì)量數(shù)據(jù)采集成本極高,真機與動作捕捉投入巨大,難以負擔(dān);模型能力難以跨本體遷移,數(shù)據(jù)孤島化且缺乏統(tǒng)一評估標(biāo)準(zhǔn)……這些底層采集方案與數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計上的挑戰(zhàn),恰恰意味著行業(yè)新機會。

      隨后,他梳理出當(dāng)下主流技術(shù)路線:大腦(system 2)負責(zé)理解物理世界常識與人類指令,分解復(fù)雜任務(wù);小腦負責(zé)技能,如抓取、按壓等,需人類示教與標(biāo)注數(shù)據(jù)。二者需端到端融合訓(xùn)練。不同流派都需要大量異構(gòu)數(shù)據(jù)、人工參與,以及跨場景、跨任務(wù)的泛化能力。

      佟顯喬把數(shù)據(jù)采集現(xiàn)狀歸納為兩條路徑:

      真機端:以末端執(zhí)行器動捕、人類視覺示教、同構(gòu)遙操及“光慣混合操作”為主;

      仿真端:圍繞軌跡合成、資產(chǎn)合成、預(yù)測生成與決策生成等維度展開。

      作為極數(shù)迭代聯(lián)合創(chuàng)始人兼 CEO、機器人與自動駕駛領(lǐng)域?qū)<遥★@喬曾在百度美研、蘋果、英偉達等公司深耕多年。接著,他分享了具身智能數(shù)據(jù)平臺的設(shè)計思路。

      一方面,平臺化可針對場景做系統(tǒng)化設(shè)計,在高效與可靠之間取得平衡,鎖定數(shù)據(jù)標(biāo)準(zhǔn),提升真機與仿真采集效率,并優(yōu)化部署對接;另一方面,通過兼容性設(shè)計與低代碼接口降低使用門檻。

      他還提出真機數(shù)據(jù)的“萬物皆可達”、仿真數(shù)據(jù)的“萬物皆可生”兩大系統(tǒng),并引入 AI Agent 概念,借助大模型完成自動標(biāo)注、資源管理與模型評測,構(gòu)建完整數(shù)據(jù)工具鏈。實測下來,真實世界數(shù)據(jù)集構(gòu)建速度提升 30×,仿真數(shù)據(jù)生成提升 3.5×,以數(shù)據(jù)飛輪方式加速模型迭代。

      分享結(jié)尾,佟顯喬給出判斷數(shù)據(jù)好壞的經(jīng)典洞察:“從最終模型反推——能讓模型表現(xiàn)優(yōu)異的數(shù)據(jù),就是好數(shù)據(jù)。”

      圓桌論壇:具身數(shù)據(jù)如何塑造行業(yè)未來?


      數(shù)據(jù)專場的最后環(huán)節(jié),以具身數(shù)據(jù)為主題的圓桌論壇在王建明的主持下正式開始。王建明、戴若犁、佟顯喬、丁琰四位嘉賓圍繞具身數(shù)據(jù)采集、數(shù)據(jù)飛輪等議題展開了深度對話。

      對機器人而言,什么是好的數(shù)據(jù)?王建明以數(shù)據(jù)質(zhì)量切入,幾位嘉賓就“以終為始”達成了共識,最終的模型性能、訓(xùn)練中機器人的受益程度反映著數(shù)據(jù)的質(zhì)量。丁琰進一步指出,采集成本和各種數(shù)采方式對于不同場景和硬件的適配與否,都是決定數(shù)據(jù)質(zhì)量的關(guān)鍵環(huán)節(jié)。

      未來的數(shù)據(jù)采集方式或?qū)⒆呦蚨嘣W鳛橐患矣袛?shù)據(jù)能力的創(chuàng)業(yè)公司,丁琰表示,鹿明機器人正在籌建自己的數(shù)采廠。出于成本考慮,現(xiàn)階段采用UMI方式進行數(shù)據(jù)采集,但未來仍可能引進更多方案。“遙操作、UMI(Universal Manipulation Interface)、動捕、仿真數(shù)據(jù),存在即合理。”丁琰強調(diào)。

      戴若犁就In-the-wild的數(shù)據(jù)采集方式發(fā)出了提醒,他指出這是一種高度考驗技術(shù)水平的方案,其落地需要先后克服軟硬件易用性、組織管理能力兩道難關(guān),而在當(dāng)前的時間節(jié)點,邁過前者的技術(shù)門檻無疑更為重要。

      具體而言,在采集階段需要低摩擦、高精度、多模態(tài)的數(shù)采設(shè)備,野采數(shù)據(jù)的利用,還需要從稀疏原始數(shù)據(jù)中得到稠密信息的技術(shù)方案。戴若犁認為,一條可行的鏈路是通過世界模型進行先驗估計。相較之下,遠未到比拼人力組織能力的時間。

      佟顯喬認為,數(shù)據(jù)采集行業(yè)仍處于早期階段,數(shù)據(jù)、本體、模型公司仍在相互磨合。不同的模型公司提出了不同的需求,這意味著數(shù)據(jù)采集公司不能停留于堆人力的體力活階段,而是要懂模型、給建議。“模型公司也需要你的knowledge”,佟顯喬強調(diào),“一個個批次之后,大家才能一起做得更好。”

      02

      AI的“大腦”革命:一腦,何以多形?

      過去兩年,具身智能的火熱源于一個共同期待:大語言模型的出色能力有目共睹,若將其接入機器人,有望賦予機器人更聰明的大腦,從而為行業(yè)打開新空間。

      然而熱鬧兩年后,具身智能仍沒有標(biāo)準(zhǔn)答案。在眾多技術(shù)路線中,“一腦多形”被提及得最多——同一套智能系統(tǒng),可適配人形、車形等不同形態(tài),只要場景需要,外形可變,核心大腦不變。

      接下來登場的嘉賓們,對“一腦多形”帶來了不同方向的詮釋和分享。

      微分智飛創(chuàng)始人高飛教授:智能飛行機器人研究進展及產(chǎn)業(yè)應(yīng)用


      率先登場的,是微分智飛創(chuàng)始人高飛教授,他帶來的分享主題是《智能飛行機器

      人研究進展及產(chǎn)業(yè)應(yīng)用》。

      高飛的演講風(fēng)格極具畫面感:他用《普羅米修斯》的無人機編隊鏡頭引出“分布式集群”終極形態(tài),又用《流浪地球》的混亂場景對比“去中心化”的重要性。

      一開場,他拋出判斷:通用飛行智能正處于爆發(fā)前夜。

      隨后列出行業(yè)“老大難”問題:氣流擾動大,擦碰即墜機;機載算力弱,傳感器廉價;數(shù)據(jù)稀缺,采集比車輛/行人困難得多。

      高飛認為,這些行業(yè)難題是困難,也是機會,目前他們團隊正逐步攻克這些難關(guān),也因此會形成自己的技術(shù)護城河。

      在接下來的演講里,他從五個方面展示了團隊的技術(shù)突破。

      首先是敏捷輕量的多任務(wù)小腦,高飛教授現(xiàn)場展示了一鏡到底的實飛視頻,畫面里無人機的飛行能力非常酷炫敏捷,可以穿越各種狹窄縫隙,比專業(yè)的飛手操作更熟練。

      為了更形象說明這一點,他展示了一場長鏈路動作下飛手和機器人的人機對抗,其中包含連續(xù)倒轉(zhuǎn)穿過六個框的特技飛行等動作。實驗表明,相比高水平飛手,算法完成的軌跡質(zhì)量有明顯提升。

      這里他還提到一個細節(jié),他們團隊最小的端到端神經(jīng)網(wǎng)絡(luò)可以運行在 自重僅50 克左右的無人機上,其機載算力低于 1 Tops。借助團隊研發(fā)的自動化數(shù)據(jù)采集系統(tǒng)和合成數(shù)據(jù)生成管線,有效數(shù)據(jù)采集成本大大降低,

      大腦方面,高飛老師認為跨本體和跨場景非常重要。

      他展示了一個飛行器在無GPS和人為操作的環(huán)境下走迷宮,還展示了復(fù)雜地下空間場景中飛行器的自主決策和自主導(dǎo)航過程。

      他突出了集群系統(tǒng)和分布式群腦飛行,展示了多個一鏡到底的 demo :無人機集群穿越復(fù)雜稠密竹林的自主導(dǎo)航,以及五臺飛行機器人協(xié)同搬運載荷。

      最后,高飛教授還放了一個彩蛋。

      在家庭空間里,飛行操作一體化的飛行機器人可以幫人拿飲料、拿物品,高飛教授表示,他們已經(jīng)可以做到通過單電機線驅(qū)動機構(gòu)實現(xiàn)飛行機械手的多自由度形變,使其在穩(wěn)定飛行同時展現(xiàn)出指尖捏取和掌心抓握等交互操作能力。這種新構(gòu)型飛行器雖然操作自由度不高,但可實現(xiàn)抓了就跑,充分發(fā)揮本體移動性優(yōu)勢,未來有望應(yīng)用于短途物品運送,還可作為人手的空間延伸,通過端側(cè)輔助駕駛完成復(fù)雜任務(wù)。

      這些技術(shù)的展示充滿了對技術(shù)落地應(yīng)用的想象力。

      最后高飛對研發(fā)成果的潛在應(yīng)用也做了總結(jié),憑借“小腦-大腦-群腦”三位一體方案,飛行具身智能體目前已經(jīng)可以代替人進入高危環(huán)境完成信息采集,也正在推進在安防巡檢、物流運輸?shù)葓鼍暗穆涞貞?yīng)用。

      寧波東方理工大學(xué)的助理教授金鑫:空間智能技術(shù)在自動駕駛及具身機器人中的初步探索與應(yīng)用


      寧波東方理工大學(xué)的助理教授金鑫,做了題為《空間智能技術(shù)在自動駕駛及具身機器人中的初步探索與應(yīng)用》的分享。

      金鑫表示,其團隊圍繞空間智能在自動駕駛與機器人領(lǐng)域的應(yīng)用進行了初步探索。他將空間智能分為三個層級:基礎(chǔ)的空間感知(構(gòu)建3D世界)、進階的空間交互(支持智能體與環(huán)境的互動)以及最終的空間理解與生成(基于對世界的理解創(chuàng)造數(shù)據(jù))。

      團隊將工作細分為空間構(gòu)建與智能體訓(xùn)練兩部分,并形成了“建模-訓(xùn)練-迭代優(yōu)化”的閉環(huán)研發(fā)飛輪。

      在自動駕駛領(lǐng)域,針對真實數(shù)據(jù)采集難以覆蓋極端場景的痛點,團隊提出了以“占據(jù)柵格”(Occupancy)為中心的生成方案UniScene(CVPR25)。金鑫指出,Occupancy是連接場景理解與多模態(tài)生成的理想橋梁,它兼顧了必要的語義和幾何信息。

      基于此,團隊開發(fā)了兩階段生成流程:先由鳥瞰圖布局生成語義Occupancy,再以此衍生出激光雷達點云與多視角視頻。該方案的迭代版本(UniScene V2)新增了深度與語義分割模態(tài),并支持按傳感器位置生成數(shù)據(jù),目前已與理想汽車合作測試其在復(fù)雜場景下的泛化能力。

      更進一步,團隊在近期的工作OmniNWM中,引入了“規(guī)劃-生成”的閉環(huán)機制。

      金鑫解釋道,該模型能將規(guī)劃的軌跡作為條件輸入,預(yù)測未來場景變化,并在世界模型內(nèi)部通過計算Occupancy的物理指標(biāo)(如碰撞、速度)實現(xiàn)獎勵反饋與閉環(huán)優(yōu)化,從而構(gòu)建“萬能駕駛導(dǎo)航世界模型”。

      在機器人領(lǐng)域,團隊將相同方法論遷移,用于生成機器人訓(xùn)練數(shù)據(jù),提出ORV框架。

      針對第一人稱視角數(shù)據(jù)稀缺的問題,團隊構(gòu)建了InterVLA數(shù)據(jù)集,通過學(xué)生模擬機器人并佩戴GoPro,配合動捕設(shè)備,采集了包含語言指令、多視角視頻與動作軌跡的數(shù)據(jù)。同時,團隊與北京銀河通用合作研發(fā)的DreamVLA模型,其核心思想是將大語言模型的“思維鏈”思想引入視覺-語言-動作模型,讓模型在輸出最終動作前,先在潛在空間中推理出“世界知識”(如哪些物體需移動、深度估計等),從而提升決策的可解釋性與泛化能力。

      此外,針對機器人方位感知弱的問題,團隊還提出了模塊化的“方位基礎(chǔ)模型”,使其能像人一樣抓取物體的合適部位(如瓶身而非瓶蓋)。最后,金鑫介紹了將“解耦學(xué)習(xí)”嵌入世界模型的工作(DisWM,ICCV25),旨在從仿真環(huán)境的視覺輸入中分離出與任務(wù)無關(guān)的干擾因素(如光照、紋理),使智能體能更專注于關(guān)鍵信息,從而提升訓(xùn)練效率與在真實世界的魯棒性。

      他表示,上述技術(shù)正逐漸嘗試走出實驗室,探索產(chǎn)業(yè)化可能。

      上海人工智能實驗室青年科學(xué)家王靖博:人形機器人,從“盲動”走向“感知驅(qū)動”


      隨后,上海人工智能實驗室青年科學(xué)家王靖博帶來了主題演講《從虛擬走向現(xiàn)實,構(gòu)建通用人形機器人控制與交互策略》。

      長期以來,人形機器人的研究是否必要一直存在著爭議。演講伊始,王靖博博士就對此做出了回應(yīng)。他指出,由人類搭建的真實生活環(huán)境,也面向人類的各種需求,這決定了人形必然是一種相對通用的方案。在數(shù)據(jù)維度,互聯(lián)網(wǎng)上有大量來源于人類日常生活的第一人稱及第三人稱數(shù)據(jù),其中包含的運動邏輯和操作邏輯,對于模型訓(xùn)練來說都是可用資源。在應(yīng)用層,人形機器人的交互邏輯、安全性等研究,最終也會回饋到人自身。

      而人形機器人現(xiàn)階段研究的核心問題之一,就是如何在仿真中訓(xùn)練機器人,并使其在真實世界中實現(xiàn)穩(wěn)定、可泛化的運動與控制。由于仿真環(huán)境與真實物理世界之間存在的差異,人形機器人的技能訓(xùn)練與部署長期面臨著Sim2Real的鴻溝。對此,王靖博博士介紹了其團隊的最新成果,通過對日常生活環(huán)境的集成性構(gòu)造,以及創(chuàng)新的感知和表示方案,顯著提升了復(fù)雜地形下運動策略的遷移成功率。其核心在于用體素化的點云表示壓縮環(huán)境信息,并在仿真中引入機器人本體的激光雷達自掃描,以更好地對齊仿真與真實的傳感器數(shù)據(jù)分布,從而使機器人能提前感知地形變化,如臺階、吊頂,并預(yù)先規(guī)劃動作,而非依賴碰撞后的力反饋。

      此外,王靖博博士在演講中提到了構(gòu)建統(tǒng)一的動作技能表征,作為基礎(chǔ)的人形機器人運動控制模型,可以進一步拓展在有效的可遷移的人形機器人感知方案下的動作與技能選擇,使得人形機器人可以在基礎(chǔ)的運動之外完成和場景的交互已經(jīng)多種球類運動。

      在演講中,王靖博博士進一步指出,人形機器人的控制策略正從“盲走盲動”轉(zhuǎn)向“感知驅(qū)動”,融合視覺、激光雷達等環(huán)境感知,以實現(xiàn)機器人在復(fù)雜、非結(jié)構(gòu)化環(huán)境中的自主導(dǎo)航與交互是必然趨勢。關(guān)于人形機器人的未來,王靖博博士認為,當(dāng)前的模型參數(shù)量和學(xué)習(xí)方式限制了技能容量和更多元控制形式的探索。長遠來看,構(gòu)建容量更大,更高效利用數(shù)據(jù)的方案,例如離線的監(jiān)督學(xué)習(xí),是提升機器人技能通用性和長程控制能力的可行路徑。

      一腦多形圓桌論壇:探索?落地?未來


      演講過后,一場關(guān)于“一腦多形”的圓桌論壇,將整個會場氣氛推向高潮。在英諾天使基金ED王建明的主持下,浙江大學(xué)控制學(xué)院副教授,微分智飛創(chuàng)始人高飛,寧波東方理工大學(xué)助理教授金鑫,上海人工智能實驗室青年科學(xué)家王靖博三位嘉賓圍繞著具身智能、世界模型等話題進行了熱烈討論。

      首先,王建明拋出一個共性問題,邀請三位嘉賓用簡短的話語,概括近兩年具身智能在學(xué)術(shù)與產(chǎn)業(yè)領(lǐng)域的發(fā)展進展。

      對此,高飛直言:“現(xiàn)在還沒到技術(shù)路線收斂的時候,行業(yè)仍處于探索階段。這一波技術(shù)浪潮的本質(zhì),是 AI 與機器人本體結(jié)合后,帶來的智能性與泛化性飛躍。” 他同時強調(diào),從業(yè)者要時刻牢記做具身智能的初心。金鑫對此表示認同,并補充道:“這兩年高校在具身智能領(lǐng)域的機會,相較于產(chǎn)業(yè)界其實要少一些。未來不妨將核心關(guān)鍵問題交由高校攻關(guān),產(chǎn)業(yè)界則專注于技術(shù)落地轉(zhuǎn)化。”

      王靖博也分享了自己的觀察:“人形機器人其實十年前就有波士頓動力在做運動能力的展示,但一直沒能真正走進大眾的應(yīng)用場景。而當(dāng)軟硬件的code design的理念出現(xiàn)后,整個領(lǐng)域的發(fā)展節(jié)奏明顯加快了。”

      隨后,王建明針對各個嘉賓的研究方向分別提出了不同的問題。首先向高飛的demo提出稱贊,高飛認為自己相對來講,是無人機比較懂AI的,是AI里比較懂無人機的。無人機的技術(shù)范式會往端到端的方向傾斜,端到端則是指:進來的是圖像等傳感器數(shù)據(jù),輸出的是電機控制指令。最后,高飛表示,端到端是一種范式,強化學(xué)習(xí)是一種解法,黑箱是一種模式,三者是不一樣的概念,不宜直接畫等號。

      后面,又對世界模型進行了探討,現(xiàn)在世界模型的定義都沒有達成共識,金鑫認為,自動駕駛和機器人這兩個任務(wù)對世界模型的要求和技術(shù)范式都是有很大的區(qū)別的,世界模型是一個非常大的概念。而在自動駕駛中,視頻生成比較主流一些,因為涉及到安全性的問題。

      金鑫還指出,世界模型與 VLA 模型并非對立關(guān)系,二者完全可以結(jié)合應(yīng)用。他提到,他與清華、科大合作的一篇survey前一天剛上線,文章專門探討了這一問題,要么先建世界模型再做policy learning,要么兩個一起做。

      當(dāng)被問及 “何時能實現(xiàn)性能優(yōu)異的通用控制器” 時,王靖博從仿真與現(xiàn)實兩個維度給出答案:如果是在仿真器里面,不去做例舉的限制,實現(xiàn)一個還不錯的控制器還可以,只是要精度和平衡性之間找到最優(yōu)解。如果是在真實世界上,這個就得看算法和硬件了。他以自己實驗室的實踐舉例,相同的算法在不同的人形機器人上運行,會得出截然不同的結(jié)果,最終得由硬件性能來決定。

      論壇尾聲,嘉賓們將話題拉回到技術(shù)落地這一核心議題。高飛暢想:未來說不定我們會在生活中看到各種各樣的無人機,這也是他的夢想,他還調(diào)侃道,如果未來沒有各種無人機高空作業(yè)或者送人送貨的活,這是他們這幫學(xué)者、創(chuàng)業(yè)者的失敗。

      金鑫對于具身智能的落地則表示,不想回到工業(yè)自動化的階段,但現(xiàn)在工業(yè)自動化那邊的需求很著急,希望趕緊把機器人用起來。這是一個很大的gap,創(chuàng)業(yè)者腦海中的想法和實際情況有差距,上級會讓你快讀落地,投資人在其中扮演的角色是既讓技術(shù)人員很著急,又讓需求方不能那么著急,將這種困境概括成一句話就是——“既要星辰大海,也要趕緊賺錢。”

      王靖博則基于自身的觀察給出了審慎的判斷:落地還比較遙遠,但今年已經(jīng)給大家看到了很多希望,至少我們在現(xiàn)實生活中,已經(jīng)能見到相關(guān)技術(shù)的落地應(yīng)用,而不再是像看波士頓動力的 Atlas 機器人那樣,如同觀看科幻大片。

      伴隨著對未來的暢想與探討,數(shù)據(jù)&一腦多形分論壇圓滿落幕。

      未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉(zhuǎn)載!

      公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      荷蘭“草臺班子”倒臺!聞泰科技慘賠135億被坑?真相大快人心

      荷蘭“草臺班子”倒臺!聞泰科技慘賠135億被坑?真相大快人心

      閱微札記
      2026-02-06 16:24:42
      王陽明:擺脫精神內(nèi)耗最好的方法,不是運動、獨處,而是......

      王陽明:擺脫精神內(nèi)耗最好的方法,不是運動、獨處,而是......

      詩詞中國
      2026-02-01 19:42:22
      警惕你身邊那些整天叫囂“基本盤”的人

      警惕你身邊那些整天叫囂“基本盤”的人

      守望的田野
      2026-02-06 09:02:57
      曝東契奇腿筋傷勢并無大礙!明日大概率缺戰(zhàn)勇士 專家預(yù)測歇1-2周

      曝東契奇腿筋傷勢并無大礙!明日大概率缺戰(zhàn)勇士 專家預(yù)測歇1-2周

      羅說NBA
      2026-02-07 05:18:13
      恭喜!知名歌手官宣結(jié)婚

      恭喜!知名歌手官宣結(jié)婚

      廣州生活美食圈
      2026-02-05 11:40:10
      蘿莉島,是進入核心圈層的投名狀,你猜他們?yōu)槭裁炊即┘t皮鞋

      蘿莉島,是進入核心圈層的投名狀,你猜他們?yōu)槭裁炊即┘t皮鞋

      月滿大江流
      2026-02-06 09:25:07
      千萬粉絲一夜清零:軍事頂流“聽風(fēng)的蠶”被封,踩中了哪些紅線?

      千萬粉絲一夜清零:軍事頂流“聽風(fēng)的蠶”被封,踩中了哪些紅線?

      月滿大江流
      2026-02-05 09:17:22
      遼寧對全省住建系統(tǒng)開展專項巡視巡察,主動投案90人,留置122人

      遼寧對全省住建系統(tǒng)開展專項巡視巡察,主動投案90人,留置122人

      金臺資訊
      2026-02-06 20:17:23
      網(wǎng)友稱四川自貢一街道現(xiàn)“紅綠燈刺客”,紅燈籠遮擋信號燈致誤闖,當(dāng)?shù)亟痪貞?yīng):將迅速核實

      網(wǎng)友稱四川自貢一街道現(xiàn)“紅綠燈刺客”,紅燈籠遮擋信號燈致誤闖,當(dāng)?shù)亟痪貞?yīng):將迅速核實

      大風(fēng)新聞
      2026-02-06 17:21:05
      SU7 Ultra團隊內(nèi)幕曝光,捅了雷軍一刀

      SU7 Ultra團隊內(nèi)幕曝光,捅了雷軍一刀

      品牌頭版
      2026-02-05 18:38:16
      蘿莉島文件再公開!背后更可怕的,是每年50萬“消失的孩子”

      蘿莉島文件再公開!背后更可怕的,是每年50萬“消失的孩子”

      秋楓凋零
      2026-02-04 21:04:24
      連續(xù)19個跌停!000638,去年營收或?qū)⒌陀?億元

      連續(xù)19個跌停!000638,去年營收或?qū)⒌陀?億元

      大眾證券報
      2026-02-06 20:04:42
      當(dāng)年舉報畢福劍的張清,落得何種結(jié)局?

      當(dāng)年舉報畢福劍的張清,落得何種結(jié)局?

      霹靂炮
      2026-02-06 22:01:54
      普京“五大心腹”陸續(xù)交權(quán)隱退,“后普京時代”或?qū)⑻崆暗絹?>
    </a>
        <h3>
      <a href=樂享人生風(fēng)雨
      2026-02-06 17:19:35
      越南選美皇后墜落紅塵:600萬越盾/次,賺快錢兒,當(dāng)場被警方抓獲

      越南選美皇后墜落紅塵:600萬越盾/次,賺快錢兒,當(dāng)場被警方抓獲

      越南語學(xué)習(xí)平臺
      2026-02-06 09:45:08
      “被虧待的人就這面相”,大二女生視頻火了,不被愛的痕跡太明顯

      “被虧待的人就這面相”,大二女生視頻火了,不被愛的痕跡太明顯

      妍妍教育日記
      2026-02-06 20:18:00
      歐盟委員會主席馮德萊恩:歐盟委員會正提出對俄羅斯一攬子新制裁措施

      歐盟委員會主席馮德萊恩:歐盟委員會正提出對俄羅斯一攬子新制裁措施

      財聯(lián)社
      2026-02-06 22:10:11
      “中國只要13天298英鎊,英國要2年3700英鎊”,老外紛紛點贊到中國看病!會不會擠占醫(yī)療資源,三級醫(yī)院院長:遠未達到

      “中國只要13天298英鎊,英國要2年3700英鎊”,老外紛紛點贊到中國看病!會不會擠占醫(yī)療資源,三級醫(yī)院院長:遠未達到

      每日經(jīng)濟新聞
      2026-02-03 23:34:17
      武漢新娘給黑人DJ留言事件,把我人都看麻了

      武漢新娘給黑人DJ留言事件,把我人都看麻了

      聽風(fēng)聽你
      2026-02-03 21:37:44
      演都不演了?被央視點名僅5天,周深走上大衣哥老路,韓紅沒說謊

      演都不演了?被央視點名僅5天,周深走上大衣哥老路,韓紅沒說謊

      暖心萌阿菇?jīng)?/span>
      2026-02-05 19:59:29
      2026-02-07 06:48:49
      AI科技評論 incentive-icons
      AI科技評論
      點評學(xué)術(shù),服務(wù)AI
      7071文章數(shù) 20728關(guān)注度
      往期回顧 全部

      科技要聞

      獨角獸版圖巨變:SpaceX奔萬億 中美差在哪

      頭條要聞

      電動車行業(yè)"老三"沖刺上市 分股東2億克扣員工社保3億

      頭條要聞

      電動車行業(yè)"老三"沖刺上市 分股東2億克扣員工社保3億

      體育要聞

      西甲射手榜第2,身價不到姆巴佩1/40

      娛樂要聞

      微博之夜搶C風(fēng)波 楊冪工作室9字討說法

      財經(jīng)要聞

      愛爾眼科董事長旗下7家精神病院騙保

      汽車要聞

      寶馬"本命年"關(guān)鍵詞:20款新車與"新世代"耐力賽

      態(tài)度原創(chuàng)

      數(shù)碼
      家居
      本地
      手機
      軍事航空

      數(shù)碼要聞

      【IT之家開箱】羅技GPW5雪豹電競鼠標(biāo)圖賞,業(yè)界首發(fā)可調(diào)電磁微動

      家居要聞

      現(xiàn)代輕奢 溫馨治愈系

      本地新聞

      圍觀了北京第一屆黑色羽絨服大賽,我笑瘋了

      手機要聞

      紅米K90至尊版再次被確認:雙芯+主動風(fēng)扇+8500mAh大電池,價格謎

      軍事要聞

      美國“肯尼迪”號核動力航母完成首次海試

      無障礙瀏覽 進入關(guān)懷版