![]()
智東西
編輯 EAIRCon 2025
11月19日,由智一科技旗下智猩猩、智東西共同發(fā)起主辦,機(jī)器人前瞻、極果協(xié)辦的2025中國(guó)具身智能機(jī)器人大會(huì)(EAIRCon 2025)在深圳舉行,在具身智能人形機(jī)器人專題論壇上,云天勵(lì)飛副總裁羅憶以《芯智AI,具身未來(lái)》為主題發(fā)表演講。
云天勵(lì)飛副總裁羅憶談道,AI技術(shù)發(fā)展經(jīng)歷了邏輯推理、專家系統(tǒng)到AI人機(jī)協(xié)同的三次浪潮,大模型的出現(xiàn)為機(jī)器人從專業(yè)走向通用帶來(lái)曙光,并帶來(lái)了從“懂控制”到“會(huì)思考”的范式變化。
但當(dāng)下,具身智能仍面臨算法與數(shù)據(jù)、技術(shù)路線選擇、算力瓶頸等多方面的挑戰(zhàn)。
從AI芯片視角來(lái)看,國(guó)內(nèi)廠商給出了具身智能算力新路徑:云天勵(lì)飛在其四代NPU的基礎(chǔ)上,正研發(fā)第五代GPNPU架構(gòu)Nova 500,可無(wú)縫對(duì)接CUDA生態(tài),適配各類大模型架構(gòu),并通過(guò)“算力積木”等技術(shù),提升大模型推理效率,推動(dòng)具身智能破解算力挑戰(zhàn)。
目前,其多款芯片模型作為協(xié)處理器助力普渡科技、賽特智能等客戶落地項(xiàng)目;該公司還落地廣東某區(qū)機(jī)器人指揮平臺(tái),實(shí)現(xiàn)“感知-決策-處置-確認(rèn)”的業(yè)務(wù)閉環(huán),支持多形態(tài)機(jī)器人的統(tǒng)一管理調(diào)度。
以下為羅憶的演講實(shí)錄:
云天勵(lì)飛是AI推理芯片的廠商,希望能夠更好地服務(wù)具身智能產(chǎn)業(yè)。對(duì)于產(chǎn)業(yè)和整個(gè)市場(chǎng),我們將從芯片廠商的視角,和大家做一些分享。
大家越來(lái)越形成了一些共識(shí)——AI正推動(dòng)第四次工業(yè)革命,包括工業(yè)界、產(chǎn)業(yè)界,還有中央文件,都有AI滲透的共識(shí)。云天勵(lì)飛正是在這一波AI浪潮的起始時(shí)于2014年創(chuàng)立。
一、把握AI發(fā)展的第三波浪潮,機(jī)器人從專用走向通用
AI技術(shù)發(fā)展經(jīng)歷了三波浪潮:第一波以感知智能為主,深度學(xué)習(xí)的算法更多解決的是感知的問(wèn)題;第二波是從Transformer的架構(gòu)被提出之后,從2022年到現(xiàn)在的生成式AI,我們發(fā)現(xiàn)感知問(wèn)題基本被解決之后,機(jī)器學(xué)會(huì)了思考,它有了一定的決策的能力;第三波浪潮,它的終局一定是讓AI或者機(jī)器能具備行動(dòng)的能力,這個(gè)行動(dòng)能力,可能是指AI或者機(jī)器的雙手長(zhǎng)在互聯(lián)網(wǎng)上,如MPC接口。在未來(lái)的企業(yè)里,除了有血有肉的真人員工外,很多數(shù)字人員工也會(huì)上崗。
![]()
我們未來(lái)會(huì)有三個(gè)機(jī)器人陪伴你生活、出行以及幫你去打工,在企業(yè)里面未來(lái)也可能有真人、數(shù)字人和機(jī)器人。作為智能,它需要有感知能力、決策能力,以及回饋物理世界的行動(dòng)能力。我們認(rèn)為這是一個(gè)發(fā)展的趨勢(shì)。
對(duì)于機(jī)器人產(chǎn)業(yè),大家印象比較深的可能是波士頓動(dòng)力人形機(jī)器人的運(yùn)動(dòng)能力,包括今年宇樹等機(jī)器人在產(chǎn)業(yè)應(yīng)用上把運(yùn)動(dòng)控制做到了極致,從可行性到量產(chǎn)降本。如果要真正能去工廠打螺絲,真正能夠?qū)崿F(xiàn)百千量級(jí)進(jìn)入工廠,雖然感覺機(jī)器人還差一口氣,但我們可以看到很多的技術(shù)路線都正不斷探索中。
大模型為機(jī)器人帶來(lái)了范式改變。不管是原來(lái)的認(rèn)知感知,還是現(xiàn)在的大模型、具身智能,在很多技術(shù)路線上,我們會(huì)選擇參考海外頭部企業(yè)的做法。比如,我們關(guān)注到了馬斯克的Optimus機(jī)器人。機(jī)器人在我們看來(lái)更像無(wú)人車,無(wú)人車是另一種代替我們出行的機(jī)器人。馬斯克團(tuán)隊(duì)把FSD(特斯拉的全自動(dòng)駕駛技術(shù))的方法論泛化到機(jī)器人上,通過(guò)工業(yè)降本、量產(chǎn)、產(chǎn)業(yè)化的方式,將大量的機(jī)器人投放到實(shí)際的運(yùn)行環(huán)境中,在真實(shí)環(huán)境中去構(gòu)建數(shù)據(jù)飛輪等。這一系列的有效嘗試,正推動(dòng)具身智能產(chǎn)業(yè)快速發(fā)展。
![]()
二、具身智能的挑戰(zhàn):算法、數(shù)據(jù)、技術(shù)路線和算力瓶頸
從技術(shù)上來(lái)講,具身智能和AI相同。AI三要素包括算法、數(shù)據(jù)、算力,機(jī)器人產(chǎn)業(yè)的三大核心要素仍然是算法、數(shù)據(jù)、硬件,這里的硬件包括控制、靈巧手等更復(fù)雜的系統(tǒng),這三大要素需要更協(xié)同的發(fā)展。
![]()
在技術(shù)路線上,以宇樹為代表的企業(yè),他們開發(fā)的機(jī)器人的小腦發(fā)育度很高,能以更低的成本做出非常靈活的動(dòng)作。但目前,機(jī)器人能真正接受人的指令,去泛化進(jìn)入陌生的場(chǎng)景完成簡(jiǎn)單任務(wù),這件事仍然很難,即大腦的發(fā)育還存在困難。
我認(rèn)為具身智能的發(fā)展有一些困難點(diǎn),一方面是算法和數(shù)據(jù)。
這是一個(gè)相對(duì)的概念,在不同的發(fā)展階段,機(jī)器人總有可適應(yīng)的場(chǎng)景,哪怕只是一個(gè)具備小腦的機(jī)器人,它也可以進(jìn)行表演和娛樂(lè)。
不過(guò),機(jī)器人的發(fā)展是螺旋上升的過(guò)程。具身智能的復(fù)雜度相對(duì)于智能駕駛的復(fù)雜度高了幾個(gè)維度,兩者數(shù)據(jù)缺口的對(duì)比可能差了5到6個(gè)量級(jí)。
所以,在開發(fā)具身智能的過(guò)程中,怎么更低成本地獲取訓(xùn)練的數(shù)據(jù)、創(chuàng)新算法,并在限定的環(huán)境之下找到它的應(yīng)用場(chǎng)景,通過(guò)這些場(chǎng)景的落地來(lái)生產(chǎn)更多的數(shù)據(jù),反哺整個(gè)產(chǎn)業(yè)的發(fā)展,我覺得這是業(yè)界需要探索的問(wèn)題。
另一個(gè)方面,具身智能仍有多個(gè)方向的技術(shù)路線正在探索。例如,如何把大模型時(shí)代的“慢思考”能力帶入機(jī)器人系統(tǒng);再比如,機(jī)器人系統(tǒng)是大小腦的協(xié)同,如何把一個(gè)決策任務(wù)做到更精致?如何在準(zhǔn)確性和高效性上找到一個(gè)平衡點(diǎn)?包括類似于像FSD的端到端的模型,它不能完全解決所有的問(wèn)題,其數(shù)據(jù)質(zhì)量敏感性、人類操作員不良操作的數(shù)據(jù)污染問(wèn)題,都需要進(jìn)行綜合考量。
從算力或者說(shuō)芯片廠商的視角,推動(dòng)具身產(chǎn)業(yè)的發(fā)展需要什么樣的算力支撐,我們覺得有兩個(gè)方向的考量,在這里借鑒一下英偉達(dá)的觀點(diǎn)。
老黃曾經(jīng)說(shuō)過(guò),具身智能需要3臺(tái)機(jī)器:第一臺(tái)機(jī)器是用超級(jí)計(jì)算機(jī)來(lái)做模型訓(xùn)練;第二臺(tái)機(jī)器需要構(gòu)建一個(gè)仿真的環(huán)境,讓具身智能能夠在這個(gè)仿真環(huán)境里面進(jìn)行測(cè)試和驗(yàn)證;第三臺(tái)才是運(yùn)用到它本體的計(jì)算機(jī),這三條線在同步發(fā)展。不過(guò),特斯拉自身有產(chǎn)業(yè)鏈閉環(huán)的優(yōu)勢(shì),馬斯克的觀點(diǎn)是,他們要?jiǎng)?chuàng)造一個(gè)訓(xùn)推一體、基于本體的機(jī)器人,能夠不斷實(shí)現(xiàn)數(shù)據(jù)飛輪、自我進(jìn)化以及自我學(xué)習(xí)。
對(duì)于芯片廠商來(lái)講,中美高端AI訓(xùn)練芯片的差距還是比較大的。國(guó)內(nèi)可能只有像華為這樣的大廠,會(huì)去對(duì)標(biāo)構(gòu)建訓(xùn)練生態(tài)。絕大部分企業(yè),包括云天勵(lì)飛在內(nèi),我們更看重的是推理的市場(chǎng)。我們覺得具身智能產(chǎn)業(yè)的本體需要一顆SoC異構(gòu)芯片,同時(shí),在數(shù)據(jù)合成和整個(gè)仿真環(huán)境的推理上,需要相應(yīng)的大算力芯片。
很多產(chǎn)品有著不同的技術(shù)路徑,比如說(shuō)像機(jī)器狗包括步行類的機(jī)器人,其技能點(diǎn)主要是在運(yùn)動(dòng)控制上。在任務(wù)完成上,這類機(jī)器人可能需要一些外掛,因?yàn)樗旧淼母兄芰κ墙鉀Q運(yùn)動(dòng)性能的,因此它在進(jìn)行任務(wù)時(shí)可能需要云端的綜合調(diào)控,或者身上加一些額外負(fù)載,才能完成具體場(chǎng)景里的任務(wù),而要想做到這些都需要相關(guān)的算力。
![]()
云天勵(lì)飛作為國(guó)內(nèi)廠商,正提供配套算力助推產(chǎn)業(yè)的發(fā)展。
三、創(chuàng)新“算力積木”AI推理架構(gòu),將推第五代GPNPU芯片
云天勵(lì)飛,2014年于深圳成立;2023年登陸上交所科創(chuàng)板。公司一直專注在AI推理芯片這個(gè)領(lǐng)域,過(guò)去芯片在智慧城市的各個(gè)細(xì)分場(chǎng)景,還有機(jī)器人領(lǐng)域得到應(yīng)用。
在AI芯片領(lǐng)域,云天勵(lì)飛走的是更上游的技術(shù)路徑。我們核心的NPU指令集體系與微架構(gòu)均為自主設(shè)計(jì),這是芯片算力的根基。目前公司芯片已迭代至第四代Nova400,下一代Nova500將邁向GPNPU架構(gòu),在大模型推理上實(shí)現(xiàn)更高的并行度與能效表現(xiàn)。
從生態(tài)建設(shè)看,算法與算力需要同步演進(jìn)才能形成真正的規(guī)模效應(yīng)。機(jī)器人行業(yè)在研發(fā)與快速迭代階段,往往依賴CUDA完整的工具鏈與成熟軟件生態(tài),因此開發(fā)成本較低、速度更快。但當(dāng)產(chǎn)品進(jìn)入量產(chǎn)以后,不論是遵循國(guó)內(nèi)產(chǎn)業(yè)鏈安全要求,還是從成本結(jié)構(gòu)與能效優(yōu)勢(shì)出發(fā),國(guó)產(chǎn)AI芯片都展現(xiàn)出愈發(fā)明顯的競(jìng)爭(zhēng)力。
基于這一判斷,我們希望下一代芯片既能夠兼容CUDA生態(tài)、降低開發(fā)遷移成本,又能保持NPU架構(gòu)在功耗與能效比方面的優(yōu)勢(shì),使機(jī)器人廠商在產(chǎn)品從研發(fā)到量產(chǎn)的全周期中,都能獲得更具競(jìng)爭(zhēng)力的算力選擇。
自2020年起,我們將芯片工藝全面轉(zhuǎn)向國(guó)內(nèi)供應(yīng)鏈。在當(dāng)前國(guó)內(nèi)制程節(jié)點(diǎn)下,晶體管集成度與密度提升存在一定物理和工藝約束,單顆大芯片難以無(wú)限擴(kuò)展算力。因此,我們采用先進(jìn)封裝技術(shù),通過(guò)多Die的Chiplet組合,在一顆封裝中實(shí)現(xiàn)更高的并行度與算力密度,這一體系被我們稱為“算力積木”架構(gòu)。
在國(guó)內(nèi)工藝體系內(nèi),若不走海外先進(jìn)制程路線,要獲得高算力、高帶寬的擴(kuò)展能力,Chiplet尤其是Die-to-Die(D2D)互連幾乎已成為業(yè)內(nèi)的主流方向。通過(guò)Chiplet,可以在成本、良率、規(guī)模化、帶寬等維度實(shí)現(xiàn)更高的綜合性價(jià)比,也是當(dāng)前國(guó)產(chǎn)高性能芯片的最現(xiàn)實(shí)路線。而云天勵(lì)飛是首家在國(guó)產(chǎn)供應(yīng)商探索D2D Chiplet的公司。
![]()
目前,我們基本上已經(jīng)實(shí)現(xiàn)從單Die(芯片晶粒)、雙Die、四Die,最高到8個(gè)Die的合封,能夠供應(yīng)在端側(cè)、邊緣側(cè),包括在云端推理的芯片。
目前我們有三大系列芯片:面向云端推理的DeepVerse、面向邊緣的DeepEdge以及面向具身智能的DeepXbot。
四、做機(jī)器人“總控”平臺(tái),助力落地城市治理與服務(wù)
在具身智能產(chǎn)業(yè)鏈中,我們同時(shí)承擔(dān)兩個(gè)角色:一是上游的芯片與模組供應(yīng)商,二是機(jī)器人平臺(tái)的建設(shè)者。過(guò)去,我們的芯片和模組已經(jīng)在服務(wù)機(jī)器人、工業(yè)機(jī)器人等領(lǐng)域?qū)崿F(xiàn)規(guī)模落地;同時(shí)自研的機(jī)器人指揮調(diào)度平臺(tái)也在酒店運(yùn)營(yíng)、城市治理等場(chǎng)景持續(xù)運(yùn)行。
在廣東某區(qū),我們聯(lián)合政府建設(shè)了統(tǒng)一的機(jī)器人管控平臺(tái),接入了四輪、四足、人形、無(wú)人機(jī)以及水上機(jī)器人等多類型設(shè)備。平臺(tái)可將城市的固定攝像頭、執(zhí)法與城管人員的隨身攝像頭作為數(shù)據(jù)輸入,在事件觸發(fā)后,由系統(tǒng)調(diào)度不同類型的機(jī)器人完成現(xiàn)場(chǎng)處置,實(shí)現(xiàn)從感知到行動(dòng)的完整閉環(huán)。這不僅為政府提供了具身智能的試驗(yàn)場(chǎng)與真實(shí)場(chǎng)景,也為機(jī)器人廠商提供了部署、驗(yàn)證與展示產(chǎn)品能力的最佳平臺(tái)。
以上是我們的實(shí)踐經(jīng)驗(yàn),也非常希望借助今天的交流,與更多具身智能生態(tài)伙伴一道,共同推動(dòng)這一新興產(chǎn)業(yè)更快落地、更快走向規(guī)模化應(yīng)用。
以上是羅憶演講內(nèi)容的完整整理。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.