![]()
1961年,世界第一臺(tái)工業(yè)機(jī)器人“尤尼梅特”在美國(guó)通用汽車(chē)工廠(chǎng)上線(xiàn),重復(fù)著從壓鑄機(jī)中取出熾熱金屬零件的簡(jiǎn)單動(dòng)作,開(kāi)啟了機(jī)器人替代重復(fù)性勞動(dòng)的時(shí)代。
半個(gè)多世紀(jì)后,一臺(tái)具身智能機(jī)器人正端坐于麻將桌前,“雙眼”掃視牌面,“雙手”靈活地抓牌、理牌、判斷、出牌。近三十分鐘的牌局,考驗(yàn)的不只是技巧,更是機(jī)器人持續(xù)的觀察、思考與精準(zhǔn)操作能力。
![]()
機(jī)器人正端坐于麻將桌前打牌思考的過(guò)程
“我們是用麻將這一復(fù)雜任務(wù),展示機(jī)器人的長(zhǎng)程思考與靈巧操作能力。”靈初智能商務(wù)和采購(gòu)負(fù)責(zé)人孟福剛道出打造麻將機(jī)器人的深意。
完成這一挑戰(zhàn)的并非國(guó)際科技巨頭,而是一家成立僅一年、團(tuán)隊(duì)不過(guò)百人的創(chuàng)業(yè)公司——靈初智能。在具身智能這片火熱的新戰(zhàn)場(chǎng)上,當(dāng)大多數(shù)玩家為機(jī)器人“能跑會(huì)跳”而歡呼時(shí),這家小公司卻選擇潛入深水區(qū),專(zhuān)攻靈巧操作——這正是行業(yè)未來(lái)真正的價(jià)值高地。
![]()
具身智能是當(dāng)下最炙手可熱的賽道之一。在近日舉辦的騰訊云城市峰會(huì)上,騰訊集團(tuán)副總裁李強(qiáng)透露:“今年1至9月,中國(guó)具身智能領(lǐng)域投融資近200起,融資金額近300億元。”資本的熱浪背后,是市場(chǎng)對(duì)機(jī)器人的高度期待。特斯拉的Optimus能空手接網(wǎng)球,F(xiàn)igure在學(xué)習(xí)做家務(wù),小鵬的PX5以仿人形態(tài)穩(wěn)健行走,吸引了眾多目光。
“具身智能不應(yīng)只是機(jī)器,至少要實(shí)現(xiàn)人的部分功能。”孟福剛指出喧囂之下的關(guān)鍵問(wèn)題,盡管機(jī)器人在“運(yùn)動(dòng)”上進(jìn)步顯著,但若不能像人一樣靈活使用工具、完成精細(xì)工作,就難以真正融入人類(lèi)生產(chǎn)和生活場(chǎng)景。這意味著,在需要精細(xì)操作的“智能作業(yè)”方面,行業(yè)仍處在突破前夜。
而精細(xì)操作的瓶頸,恰恰卡在了“手”上——這在國(guó)內(nèi)幾乎是一片技術(shù)空白。拿筆寫(xiě)字、翻書(shū)、精準(zhǔn)插拔都需要高自由度手部與觸覺(jué)反饋才能完成。人手加腕部共有24個(gè)自由度,每個(gè)關(guān)節(jié)都能靈活運(yùn)動(dòng)。而市面上常見(jiàn)的靈巧手,主動(dòng)自由度只有11個(gè)或6個(gè),其余手指只能被動(dòng)帶動(dòng)。“手機(jī)充電的精度要求達(dá)到0.01毫米,這對(duì)硬件是極大考驗(yàn)。”孟福剛認(rèn)為,誰(shuí)能攻克“手”的難題,實(shí)現(xiàn)靈巧操作,誰(shuí)就抓住了下一個(gè)價(jià)值高地。
![]()
靈初智能商務(wù)和采購(gòu)負(fù)責(zé)人孟福剛
而頗有靈巧手這一技術(shù)基因的靈初智能,選擇在這片“無(wú)人區(qū)”押注未來(lái)。
CEO王啟斌曾任京東機(jī)器人總裁,在硬件及商業(yè)化領(lǐng)域擁有超過(guò)20年的實(shí)戰(zhàn)經(jīng)驗(yàn),成功主導(dǎo)機(jī)器人產(chǎn)品從定義、開(kāi)發(fā)、上市再到全球化的完整商業(yè)閉環(huán);聯(lián)合創(chuàng)始人陳源培作為“00后”技術(shù)天才,曾在全球范圍內(nèi)首次實(shí)現(xiàn)利用強(qiáng)化學(xué)習(xí)在真實(shí)世界同時(shí)控制雙臂、雙手多技能操作;公司首席科學(xué)家楊耀東,是北京大學(xué)人工智能研究院助理教授,2022年時(shí),他帶領(lǐng)華人團(tuán)隊(duì)獲得NeurIPS 2022具身靈巧操作冠軍。這個(gè)由“行業(yè)老兵+天才少年+科學(xué)家”組成的鐵三角,成為靈初智能攻堅(jiān)核心難題的底氣所在。
![]()
要攻克“靈巧操作”,靈初智能面臨算力、數(shù)據(jù)與模型的三重挑戰(zhàn)。
具身智能的核心模型需處理視覺(jué)、語(yǔ)言與動(dòng)作的協(xié)同任務(wù),算力需求極大。以靈巧手執(zhí)行30分鐘以上的長(zhǎng)程任務(wù)為例,訓(xùn)練、推理與仿真過(guò)程消耗的算力呈指數(shù)級(jí)增長(zhǎng),對(duì)創(chuàng)業(yè)公司而言無(wú)疑是沉重的負(fù)擔(dān)。
數(shù)據(jù)稀缺問(wèn)題更為棘手。“真機(jī)操作數(shù)據(jù)的成本一小時(shí)高達(dá)150美金,而更高質(zhì)量的人類(lèi)操作數(shù)據(jù)更是極度稀缺。”孟福剛揭示了行業(yè)的殘酷現(xiàn)實(shí),機(jī)器人達(dá)到理想水平,至少要200萬(wàn)小時(shí)的數(shù)據(jù)積累。
在技術(shù)路徑上,靈初選擇的“大小腦”分層路線(xiàn)也面臨新挑戰(zhàn)。靈初智能聯(lián)合創(chuàng)始人陳源培坦言:“如何實(shí)現(xiàn)大腦與小腦的高效銜接?又該如何通過(guò)強(qiáng)化學(xué)習(xí)提升整體操作成功率和泛化性?”
為應(yīng)對(duì)這些難題,靈初智能選擇與騰訊云合作。在騰訊云發(fā)布Tairos具身智能開(kāi)放平臺(tái)之初,雙方就迅速建立合作。“雙方優(yōu)勢(shì)互補(bǔ),靈初智能強(qiáng)在具身算法與靈巧操作的垂直攻堅(jiān),而騰訊云提供了從底層算力到頂層AI平臺(tái)的全棧能力。”孟福剛表示,合作讓公司將有限資源聚焦于核心創(chuàng)新,而非重復(fù)“造輪子”。
![]()
靈初智能公司近期發(fā)布的創(chuàng)新之作——Psi R0
在算力上,騰訊云高性能計(jì)算集群(HCC)提供了強(qiáng)勁動(dòng)力,支撐靈初智能“每三個(gè)月一次軟件模型迭代”的快速研發(fā)節(jié)奏。
為了解決高質(zhì)量數(shù)據(jù)稀缺的瓶頸,陳源培介紹,團(tuán)隊(duì)佩戴數(shù)據(jù)手套,深入便利店、物流倉(cāng)庫(kù)、工廠(chǎng)車(chē)間等場(chǎng)景,直接采集人類(lèi)手部操作數(shù)據(jù),再通過(guò)騰訊云Tairos平臺(tái)完成從數(shù)據(jù)準(zhǔn)備、訓(xùn)練、評(píng)測(cè)到部署的全流程管理,模型的訓(xùn)練效率不僅提升50%,還借助數(shù)據(jù)分層技術(shù)將存儲(chǔ)成本降低70%。
針對(duì)大小腦訓(xùn)練的整體性問(wèn)題,開(kāi)源開(kāi)放的Tairos平臺(tái)成為破題關(guān)鍵。孟福剛評(píng)價(jià):“從數(shù)據(jù)采集、任務(wù)分發(fā)到模型訓(xùn)練,Tairos跨業(yè)務(wù)平臺(tái)的協(xié)作能力大幅提升了團(tuán)隊(duì)的作戰(zhàn)效率。”此外,騰訊云領(lǐng)先的音視頻技術(shù)還將遙操的延時(shí)壓縮至100毫秒以?xún)?nèi),為機(jī)器人的遠(yuǎn)程搖操監(jiān)管奠定了基礎(chǔ)。
![]()
當(dāng)靈巧手在牌桌上贏得掌聲時(shí),一個(gè)更深刻的問(wèn)題擺在整個(gè)行業(yè)面前:技術(shù)演示之外,機(jī)器人的商業(yè)化路徑究竟在哪里?
基于對(duì)上百個(gè)場(chǎng)景的深入調(diào)研,靈初智能將重點(diǎn)錨定在物流行業(yè)。孟福剛解釋?zhuān)骸爸袊?guó)物流有近萬(wàn)億市場(chǎng)規(guī)模,物品類(lèi)型多樣、場(chǎng)景復(fù)雜度高,具備良好的泛化訓(xùn)練基礎(chǔ),也具備出海潛力。”在陳源培看來(lái),物流場(chǎng)景中處理的商品與家庭物品高度重疊,可視為機(jī)器人進(jìn)入家庭前的“理想訓(xùn)練場(chǎng)”。
![]()
在探索商業(yè)化路徑的過(guò)程中,靈初智能與騰訊云的合作也為行業(yè)提供了重要啟示。騰訊云構(gòu)建統(tǒng)一的智能中樞與云服務(wù),為行業(yè)提供“水電煤”,讓靈初智能這類(lèi)創(chuàng)業(yè)公司能從“全棧開(kāi)發(fā)”的重負(fù)中解脫,形成專(zhuān)業(yè)化分工、提升創(chuàng)新效率。這種分工協(xié)作讓靈初智能找到了自己的生態(tài)定位——成為專(zhuān)業(yè)的“靈巧操作”解決方案提供商,與硬件廠(chǎng)商形成賦能共生的關(guān)系。
《中國(guó)發(fā)展報(bào)告2025》顯示,具身智能市場(chǎng)規(guī)模有望在2030年達(dá)到4000億元,2035年突破萬(wàn)億元,帶動(dòng)多個(gè)應(yīng)用領(lǐng)域新質(zhì)生產(chǎn)力躍升。資本市場(chǎng)也率先投下信任票,國(guó)內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)“宇樹(shù)科技”啟動(dòng)上市流程,預(yù)示著行業(yè)正逐步走出實(shí)驗(yàn)室,邁向商業(yè)化落地的前夜。
面對(duì)市場(chǎng)升溫,孟福剛保持著冷靜的判斷。他認(rèn)為,明年下半年將有望看到一系列精細(xì)化操作落地,但大規(guī)模應(yīng)用“至少還需三年”,這個(gè)預(yù)期還是建立在數(shù)據(jù)積累、算法迭代和成本下降的客觀規(guī)律之上。實(shí)現(xiàn)規(guī)模收入尚需時(shí)間,但增長(zhǎng)空間已經(jīng)打開(kāi)。靈初智能陸續(xù)獲得日韓、中東地區(qū)的訂單,中國(guó)具身智能技術(shù)正獲得全球認(rèn)可,也向行業(yè)出海探索傳遞了積極信號(hào)。
當(dāng)靈初智能在精細(xì)化操作上不斷突破,當(dāng)騰訊云等科技巨頭以開(kāi)源生態(tài)加速行業(yè)創(chuàng)新,這背后不僅是一家企業(yè)的成長(zhǎng),更是一個(gè)產(chǎn)業(yè)生態(tài)逐步走向成熟。大浪淘沙后,那些選擇在最艱難處下功夫,并能清晰回答“誰(shuí)為何付費(fèi)”這一問(wèn)題的實(shí)干者,正是推動(dòng)整個(gè)行業(yè)向前的關(guān)鍵力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.