![]()
![]()
搜狐科技《超級瓦力——對話具身智能50人》欄目第15期,對話靈初智能聯(lián)合創(chuàng)始人陳源培。
![]()
VLA未必是終局,但現(xiàn)階段效果最好。
無論合成數(shù)據(jù)還是仿真數(shù)據(jù),都無法真正適配真實場景的復(fù)雜需求,最終還是要依賴真實數(shù)據(jù),采集成本已做到馬斯克團(tuán)隊的1/10。
中美模型差距沒那么大,國內(nèi)能追上,但中國的供應(yīng)鏈和應(yīng)用場景優(yōu)勢,美國短期難趕超。
出品|搜狐科技
作者|鄭松毅
編輯|楊 錦
當(dāng)多數(shù)人還將00后視為“新生代”時,這個群體已在具身智能賽道扛起大旗。出生于2001年的靈初智能聯(lián)合創(chuàng)始人陳源培,正是這股年輕勢力的典型代表。
從華南理工土木調(diào)劑生跨界RoboMaster全國冠軍,從北大楊耀東門下的學(xué)術(shù)探索者到斯坦福 “AI 教母” 李飛飛的門徒,再到拒絕華為 “天才少年” 邀約、以最年輕 AI 創(chuàng)業(yè)者身份躋身福布斯榜單,陳源培的每一步都在突破邊界。
這位00后少年憑借超越年齡的行業(yè)清醒,將目光鎖定靈巧手核心技術(shù),在這家“科學(xué)家密度最高” 的具身智能創(chuàng)企,其團(tuán)隊將真實數(shù)據(jù)采集成本降至馬斯克公司的 1/10,破解了行業(yè)數(shù)據(jù)瓶頸。公司更是劍指2026年百萬小時級全球最大靈巧手操作數(shù)據(jù)集,力求打造具身智能領(lǐng)域的 “ChatGPT”。
憑借 “學(xué)術(shù)大牛+產(chǎn)業(yè)老兵” 的跨代團(tuán)隊優(yōu)勢,靈初智能2024年成立即獲高瓴創(chuàng)投、藍(lán)馳創(chuàng)投領(lǐng)投的天使輪融資,且躋身英偉達(dá)初創(chuàng)加速計劃,與智元機(jī)器人達(dá)成深度合作。
00后創(chuàng)業(yè)如何平衡技術(shù)理想與商業(yè)落地的現(xiàn)實?親歷中美頂尖科研體系,如何看待兩國具身智能的發(fā)展差異?近日,搜狐科技與陳源培展開深度對話,解碼年輕力量背后的技術(shù)野心與產(chǎn)業(yè)思考。
以下為對話精編:
![]()
從跨專業(yè)到成為李飛飛門徒創(chuàng)業(yè)
搜狐科技:你從放棄土木工程跨界機(jī)器人,到拒絕斯坦福深造和華為 “天才少年” 橄欖枝選擇創(chuàng)業(yè),這些選擇在你看來算不算冒險?
陳源培:回頭看其實都挺冒險的,當(dāng)時也沒有想那么多。轉(zhuǎn)過行或者專業(yè)的人都知道,重新學(xué)一個東西還是挺需要勇氣的。很多節(jié)點可以說是能力和運(yùn)氣的疊加,不能說我每次選的都是對的,很多時候也是運(yùn)氣不錯。
搜狐科技:你本科讀的是華南理工土木工程,后來是怎么加入北大楊耀東老師團(tuán)隊的?
陳源培:當(dāng)時在打RoboMaster競賽,我們戰(zhàn)隊水平還是比較強(qiáng)的。剛好看到楊老師回國任教,就主動聯(lián)系了一下,沒想到聊得很投緣。
搜狐科技:也就是說,你雖然學(xué)的是土木,但私下一直在自學(xué)機(jī)器人算法相關(guān)知識?
陳源培:對,平時上課我基本坐在最后一排寫代碼,考前兩周才會翻書備考。
搜狐科技:你曾在美國師從 “AI 教母” 李飛飛,在你眼里,她是一位怎樣的老師?
陳源培:經(jīng)驗豐富,且很有耐心。雖然在業(yè)內(nèi)已很出名,也在忙于創(chuàng)業(yè),但仍會在教育一線給學(xué)生提供指導(dǎo)。
搜狐科技:作為福布斯榜單上的00后創(chuàng)業(yè)者,創(chuàng)業(yè)過程中是否有人因你的年齡、非博士學(xué)歷提出能力質(zhì)疑?
陳源培:會有。自我認(rèn)同感很重要,要對自己的能力和判斷有信心。
很多人拿學(xué)歷說事其實是一種偏見,我發(fā)表的論文數(shù)量并不少,對行業(yè)的認(rèn)知也不比別人差。這種刻板印象確實存在,但我覺得無所謂。
搜狐科技:作為00后創(chuàng)業(yè)者,你覺得年輕一代在具身智能領(lǐng)域的優(yōu)勢是什么?
陳源培:學(xué)習(xí)能力。在AI時代,對新事物的學(xué)習(xí)能力甚至比專業(yè)能力還要重要。哪怕是行業(yè)大佬,也需要不斷學(xué)習(xí)新知識,不然是跟不上的,AI出來后把很多東西都顛覆了。
![]()
為什么做靈巧手?
搜狐科技:為什么會選擇做靈巧手?馬斯克認(rèn)為手部是通用機(jī)器人的“終極接口”,你怎么看這個說法?
陳源培:馬斯克說的非常到位。我剛接觸靈巧手是在2022年,當(dāng)時世界上幾乎還沒有什么人做。最初的原因說出來可能出乎意料,唯一的理由就是覺得靈巧手很帥,后來發(fā)現(xiàn)強(qiáng)化學(xué)習(xí)能在(五指)上面做一些非常靈巧的操作,就一直做下來了。
搜狐科技:有業(yè)內(nèi)人士說“讓機(jī)器人后空翻需1年,可擰好瓶蓋要10年”。你覺得做好靈巧手的挑戰(zhàn)在于什么?
陳源培:后空翻、跳舞這類動作的核心是預(yù)設(shè)軌跡的精準(zhǔn)復(fù)現(xiàn),對應(yīng)的是人體小腦的功能,執(zhí)行已經(jīng)規(guī)劃好的動作,不需要復(fù)雜的環(huán)境反饋和決策。
而靈巧手的核心任務(wù)是與未知物體的交互,比如抓握雞蛋、擰瓶蓋、分揀零件,對應(yīng)的是人體大腦的功能——整合視覺、觸覺、力覺信息,進(jìn)行判斷、決策和實時調(diào)整,而不是簡單的動作執(zhí)行。
搜狐科技:所以業(yè)內(nèi)如何評判什么是好的靈巧手?看靈活度、精度還是別的?
陳源培:這是個很好的問題。從技術(shù)上說,高精度和視觸覺融合是下一代靈巧手競爭的關(guān)鍵。但這里存在一個技術(shù)悖論:增加了自由度,就要損失穩(wěn)定性;增加了精度,就要損失動態(tài)響應(yīng)特性。所以整體而言,落地好用是評判的第一標(biāo)準(zhǔn),其他指標(biāo)可以根據(jù)實際場景需求再優(yōu)化。
![]()
VLA值得做嗎?
搜狐科技:當(dāng)前具身智能行業(yè)面臨 “數(shù)據(jù)缺口” 瓶頸,行業(yè)對合成數(shù)據(jù)和真實數(shù)據(jù)的應(yīng)用存在分歧,靈初智能為何堅定押注真實數(shù)據(jù)?
陳源培:終局一定還是要依賴真實數(shù)據(jù),無論是合成數(shù)據(jù)還是仿真數(shù)據(jù),都會在數(shù)據(jù)遷移到機(jī)器人身上時出現(xiàn)embodiment gap(具身差距)問題,無法真正適配真實場景的復(fù)雜需求。
搜狐科技:但真實數(shù)據(jù)采集成本高昂的問題怎么解?
陳源培:靈初近期發(fā)布的Psi-SynEngine,從便攜式手套硬件、到數(shù)據(jù)管線、再到跨本體遷移算法,提供整套完整方案。設(shè)備方便分揀工、快遞員等不同職業(yè)的人隨身穿戴,能在低成本情況下完成數(shù)據(jù)規(guī)模化采集,成本約為馬斯克團(tuán)隊的1/10。
搜狐科技:你們計劃明年將數(shù)據(jù)集規(guī)模擴(kuò)展到百萬小時級別,這是什么概念?達(dá)到這個規(guī)模后,對訓(xùn)練具身智能大模型會帶來什么質(zhì)的變化?
陳源培:基本可以說是全球最大的靈巧手?jǐn)?shù)據(jù)集了,然后會拿它來訓(xùn)練基礎(chǔ)模型——構(gòu)建具身智能領(lǐng)域的ChatGPT。
搜狐科技:業(yè)內(nèi)對分層架構(gòu)、VLA、世界模型的技術(shù)路線也存爭議,王興興稱 VLA 是 “傻瓜式結(jié)構(gòu)”,依賴數(shù)據(jù)而非因果邏輯,靈初為何堅持 VLA 路徑?
陳源培:VLA未必是終局,但現(xiàn)階段效果最好。現(xiàn)在整個行業(yè)的數(shù)據(jù)規(guī)模還沒起來,談架構(gòu)都是空談。再過個三五年,有了足夠數(shù)據(jù),才能驗證選出哪個架構(gòu)更強(qiáng)。
![]()
行業(yè)‘過熱’了嗎?
搜狐科技:國內(nèi)現(xiàn)存數(shù)十家靈巧手玩家,行業(yè)存在“過熱”(泡沫)跡象嗎?
陳源培:肯定有。新興行業(yè)初期共識分散,后期趨同扎堆,泡沫是發(fā)展必然,很正常。
搜狐科技:未來3年,行業(yè)會是“贏家通吃”,還是保持多玩家競爭格局?
陳源培:“贏家通吃”。軟硬件技術(shù)路線都會收斂,例如誰先擁有大規(guī)模的數(shù)據(jù)占據(jù)生態(tài)位,后面就會更有優(yōu)勢。
搜狐科技:機(jī)器人已“進(jìn)廠打工”,ToC家庭場景規(guī)模化落地還要多久?
陳源培:至少10年。
搜狐科技:兼具中美技術(shù)視野,你認(rèn)為中美機(jī)器人行業(yè)有技術(shù)分野嗎?誰更具優(yōu)勢?
陳源培:差異源于國情,美國主攻模型突破,中國強(qiáng)在制造與應(yīng)用。中美模型差距沒那么大,國內(nèi)能追上;但中國的供應(yīng)鏈和應(yīng)用場景優(yōu)勢,美國短期難趕超。機(jī)器人賽道拼的場景與軟硬件相耦合,中國優(yōu)勢非常大。
![]()
![]()
運(yùn)營編輯 |曹倩審核|孟莎莎
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.