11月14日,由模力社區(qū)、機(jī)器之心主辦的「虛實(shí)共振:模型×終端技術(shù)沙龍」在北京圓滿落幕。本次沙龍緊扣具身智能這一產(chǎn)業(yè)高地,聚焦“模型×終端”的深度融合,匯聚來(lái)自產(chǎn)業(yè)界、投資界的多位專家代表,從世界模型構(gòu)建、VLA 技術(shù)突破、真機(jī)評(píng)測(cè)標(biāo)準(zhǔn)到數(shù)據(jù)驅(qū)動(dòng)范式等維度展開(kāi)了前瞻性探討。活動(dòng)不僅全景式展示了當(dāng)前技術(shù)落地的關(guān)鍵路徑,更為構(gòu)建模型與終端協(xié)同演進(jìn)的未來(lái)生態(tài)勾勒出清晰的演進(jìn)圖景。
![]()
嘉賓云集,共話行業(yè)發(fā)展
![]()
上海張江科學(xué)之門科技發(fā)展有限公司副總經(jīng)理 管鳳華
活動(dòng)伊始,上海張江科學(xué)之門科技發(fā)展有限公司副總經(jīng)理 管鳳華作為主辦方代表進(jìn)行推介。她介紹,張江模力社區(qū)作為上海人工智能產(chǎn)業(yè)的核心集聚區(qū),依托張江科學(xué)城三十余年的科創(chuàng)基礎(chǔ),是國(guó)家參與全球科技競(jìng)爭(zhēng)的重要引擎。其三大先導(dǎo)產(chǎn)業(yè)規(guī)模達(dá) 4700 億元,占上海市 GDP 四分之一,匯聚超 2.4 萬(wàn)家企業(yè)與眾多高新技術(shù)主體。社區(qū)聚焦垂類人工智能,構(gòu)建全棧式產(chǎn)業(yè)生態(tài),涵蓋算力、模型與語(yǔ)料三大要素,并通過(guò)多層次政策支持,包括首年百萬(wàn)算力補(bǔ)貼及最高兩千萬(wàn)專項(xiàng)扶持。地理上實(shí)現(xiàn)“10 分鐘產(chǎn)業(yè)觸達(dá)、5 分鐘生活配套”,并建設(shè) AI 小鎮(zhèn)服務(wù)中心,推動(dòng)技術(shù)驗(yàn)證與商業(yè)應(yīng)用。結(jié)合青創(chuàng)政策、全周期金融護(hù)航及水綠交融的城市環(huán)境,張江致力于打造有溫度的科創(chuàng)高地,助力企業(yè)與人才共創(chuàng)未來(lái)。未來(lái),模力社區(qū)期待與更多企業(yè)攜手同行,共建開(kāi)放協(xié)同、繁榮共生的產(chǎn)業(yè)生態(tài),共同推動(dòng)人工智能技術(shù)創(chuàng)新與產(chǎn)業(yè)躍遷。
![]()
北京極佳視界科技有限公司合伙人&副總裁 毛繼明
北京極佳視界科技有限公司合伙人&副總裁毛繼明先生指出,世界模型是構(gòu)建物理世界通用智能的核心基座,極佳科技在世界模型和具身大腦上的深厚積累就是要成為物理世界通用智能的引領(lǐng)者,成為物理世界的“OpenAI”,機(jī)器人時(shí)代的“蘋(píng)果”。具身智能發(fā)展可分為三階段:從硬件產(chǎn)業(yè)鏈成熟,到通用模型解決“通用大腦”問(wèn)題,最終實(shí)現(xiàn)機(jī)器人具備物理世界認(rèn)知并大規(guī)模應(yīng)用。物理世界通用智能需要融合語(yǔ)言智能與世界模型,其中世界模型可以認(rèn)為是物理世界通用智能的底層“操作系統(tǒng)”,將會(huì)成為構(gòu)建物理世界通用智能的核心基座,世界模型未來(lái)重要性日益凸顯,將會(huì)持續(xù)驅(qū)動(dòng)算法從端到端走向世界動(dòng)作模型的全新范式演進(jìn),行業(yè)巨頭如英偉達(dá)、Google、Tesla、華為、理想等等 Physical AI 公司正在積極布局,共同推動(dòng)智能時(shí)代從“工具延伸”邁向有意識(shí)、大規(guī)模改造世界的新紀(jì)元。
![]()
Dexmal 原力靈機(jī)創(chuàng)始團(tuán)隊(duì)成員 汪天才
在具身智能浪潮下,VLA(視覺(jué)-語(yǔ)言-動(dòng)作)模型面臨兩大挑戰(zhàn):缺乏統(tǒng)一高效的開(kāi)源工具箱,以及缺乏大規(guī)模公正的真機(jī)物理評(píng)測(cè)。Dexmal 原力靈機(jī)創(chuàng)始團(tuán)隊(duì)成員汪天才先生介紹了一站式 VLA 開(kāi)源工具箱 Dexbotic,它整合多種數(shù)據(jù)格式與構(gòu)型,提供強(qiáng)預(yù)訓(xùn)練模型,支持快速開(kāi)發(fā)與多仿真器統(tǒng)一評(píng)測(cè),顯著提升研發(fā)效率 3-7 倍;同時(shí),原力靈機(jī)推出全球首個(gè)具身智能的真機(jī)評(píng)測(cè)平臺(tái) RoboChallenge,基于大規(guī)模任務(wù)集Table30(包含 30 個(gè)精心設(shè)計(jì)的日常任務(wù)、2.4 萬(wàn)段視頻數(shù)據(jù))進(jìn)行公平測(cè)試,用戶可在線提交模型并獲得詳盡的性能反饋;此外,配套開(kāi)源硬件 DOS-W1 支持模塊化數(shù)據(jù)采集與即插即用,全面降低研發(fā)門檻。Dexbotic、RoboChallenge 和 DOS-W1 三者正在形成協(xié)同效應(yīng),從軟件、硬件、標(biāo)準(zhǔn)方面推動(dòng) VLA 技術(shù)發(fā)展與生態(tài)共建。
![]()
靈御智能創(chuàng)始人金戈
靈御智能創(chuàng)始人金戈先生在演講中提出,具身智能目前面臨“不可能三角”的挑戰(zhàn)——即通用性、可靠性和速度難以兼顧。傳統(tǒng)工業(yè)機(jī)器人自主性不足,模型驅(qū)動(dòng)方式雖快但泛化能力弱,核心問(wèn)題在于高質(zhì)量真機(jī)數(shù)據(jù)的嚴(yán)重匱乏。他強(qiáng)調(diào)“人在環(huán)中”是經(jīng)過(guò)驗(yàn)證的可靠路徑,通過(guò)人類介入收集復(fù)雜場(chǎng)景數(shù)據(jù),可提升模型魯棒性,例如自動(dòng)駕駛安全員和智能零售中的實(shí)時(shí)反饋。漸進(jìn)式發(fā)展路徑主張先部署有人遠(yuǎn)程操作的機(jī)器人,積累真實(shí)數(shù)據(jù)以迭代優(yōu)化,逐步實(shí)現(xiàn)自主化,類似呼叫中心向AI過(guò)渡的歷程。其公司推出的輪臂機(jī)器人以可負(fù)擔(dān)價(jià)格,結(jié)合低延遲遙操與3D感知技術(shù),已應(yīng)用于機(jī)場(chǎng)清潔等場(chǎng)景,顯著降低成本并推動(dòng)商業(yè)飛輪運(yùn)轉(zhuǎn)。這一路徑優(yōu)先聚焦工業(yè)等高容錯(cuò)需求領(lǐng)域,暫避家庭復(fù)雜環(huán)境,以數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn)具身智能的務(wù)實(shí)演進(jìn)。
![]()
智在無(wú)界靈巧手團(tuán)隊(duì)負(fù)責(zé)人袁昊琦
智在無(wú)界靈巧手團(tuán)隊(duì)負(fù)責(zé)人袁昊琦先生提出,利用海量人類視頻數(shù)據(jù)訓(xùn)練視覺(jué)-語(yǔ)言-動(dòng)作大模型,是實(shí)現(xiàn)機(jī)器人泛化操作的新路徑。當(dāng)前主流方法依賴真機(jī)遙操數(shù)據(jù),成本高、多樣性差且受限于特定本體。團(tuán)隊(duì)通過(guò)收集互聯(lián)網(wǎng)人類第一視角操作視頻,構(gòu)建自動(dòng)化標(biāo)注流程,利用自回歸架構(gòu)實(shí)現(xiàn)端到端手部動(dòng)作預(yù)測(cè),使模型在未見(jiàn)過(guò)的場(chǎng)景中具有強(qiáng)泛化能力。該方法顯著降低預(yù)訓(xùn)練對(duì)機(jī)器人真機(jī)數(shù)據(jù)的依賴;結(jié)合少量真機(jī)數(shù)據(jù)或仿真數(shù)據(jù)后訓(xùn)練,實(shí)現(xiàn)真機(jī)靈巧手高成功率、泛化的自主操作。團(tuán)隊(duì)開(kāi)源的模型支持不同本體、不同任務(wù)的微調(diào),推動(dòng)具身智能向高效、可擴(kuò)展的方向演進(jìn),實(shí)現(xiàn)“從人類數(shù)據(jù)中涌現(xiàn)智能”的愿景。
圓桌對(duì)話環(huán)節(jié),來(lái)自貝陪科技創(chuàng)始人兼 CEO 黃纓寧、阿爾法公社合伙人劉罡、影智科技產(chǎn)品負(fù)責(zé)人錢莊一同圍繞「AI 模型與終端形態(tài)的未來(lái)圖景」展開(kāi)討論,由機(jī)器之心副主編張倩擔(dān)任主持人。
![]()
從左向右依次為:機(jī)器之心副主編張倩、貝陪科技創(chuàng)始人兼 CEO 黃纓寧、阿爾法公社合伙人劉罡、影智科技產(chǎn)品負(fù)責(zé)人錢莊
貝陪科技創(chuàng)始人兼 CEO 黃纓寧女士從可豆陪陪在兒童 AI 陪伴產(chǎn)品的實(shí)踐出發(fā),深刻詮釋了具身智能的本質(zhì)在于“物理存在”與真實(shí)世界交互的能力。她指出,傳統(tǒng) AI 多依賴攝像頭采集數(shù)據(jù)后進(jìn)行云端判別,而具身智能則通過(guò)機(jī)器人本體實(shí)現(xiàn)即時(shí)感知與反饋,形成閉環(huán)響應(yīng)。她強(qiáng)調(diào),未來(lái) AI 不僅是工具,更是與兒童建立情感關(guān)系的“伙伴”,因此產(chǎn)品必須兼顧技術(shù)智能性與心理友好性,尤其在兒童發(fā)展關(guān)鍵期,需深入拆解使用場(chǎng)景、尊重成長(zhǎng)規(guī)律。其理念體現(xiàn)了從功能導(dǎo)向向關(guān)系建構(gòu)的躍遷,推動(dòng) AI 向具備社會(huì)屬性的啟蒙角色演進(jìn)。
阿爾法公社合伙人劉罡先生從早期投資視角系統(tǒng)剖析了具身智能的發(fā)展邏輯與趨勢(shì)。他認(rèn)為,具身智能是具備物理載體的人工智能,核心在于實(shí)現(xiàn)對(duì)物理世界的主動(dòng)感知與自主交互。相較于上一代判別式 AI,當(dāng)前技術(shù)更強(qiáng)調(diào)從被動(dòng)識(shí)別到主動(dòng)決策、從單模態(tài)處理到多模態(tài)融合等。他指出,新一代 AI 硬件產(chǎn)品,先不要關(guān)注“形”,要先關(guān)注“神”。拋開(kāi)形態(tài),哪些核心技術(shù)的攻克,能帶來(lái) 10 倍的增長(zhǎng)變化,就容易使產(chǎn)品具備規(guī)模化能力。作為 AI 硬件賽道最活躍的投資機(jī)構(gòu)之一,阿爾法公社致力于支持具備前瞻視野和卓越領(lǐng)導(dǎo)力,能夠在市場(chǎng)中定義新品類、創(chuàng)造新規(guī)則的非凡創(chuàng)業(yè)者,推動(dòng) AI 與物理世界交匯的范式轉(zhuǎn)變。
影智科技產(chǎn)品負(fù)責(zé)人錢莊先生結(jié)合 AI 咖啡機(jī)器人的產(chǎn)業(yè)實(shí)踐,揭示了具身智能的技術(shù)驅(qū)動(dòng)力與商業(yè)化路徑。他認(rèn)為, 2017 年以語(yǔ)音識(shí)別為代表的感官 AI 化是第一波浪潮,而當(dāng)前大模型驅(qū)動(dòng)的認(rèn)知生成能力,則使機(jī)器具備類人思維與行動(dòng)整合能力,真正實(shí)現(xiàn)“大腦+四肢”的協(xié)同。他觀察到,AI 領(lǐng)域正呈現(xiàn)新的“摩爾定律”——算力與算法日新月異,但關(guān)鍵挑戰(zhàn)在于如何將前沿技術(shù)轉(zhuǎn)化為大眾可感可用的服務(wù)。影智科技通過(guò) AI+ 機(jī)器人打造全球領(lǐng)先的咖啡大師,正是將復(fù)雜技術(shù)封裝為自然交互體驗(yàn)的典范,展現(xiàn)了具身智能從實(shí)驗(yàn)室走向日常生活的現(xiàn)實(shí)圖景。
本次技術(shù)沙龍,不僅為行業(yè)搭建了開(kāi)放協(xié)作的交流平臺(tái),也是一次思想碰撞與智慧交融的行業(yè)活動(dòng)。嘉賓們的真知灼見(jiàn),從模型架構(gòu)、數(shù)據(jù)閉環(huán)、硬件平臺(tái)到商業(yè)路徑,系統(tǒng)性地勾勒出“虛實(shí)共振”的演進(jìn)脈絡(luò),展現(xiàn)出 AI 從感知理解走向行動(dòng)干預(yù)、從虛擬認(rèn)知邁向物理交互的宏大趨勢(shì)。
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.