![]()
機器之心發布
機器之心編輯部
靈初智能發布全球首個具身原生人類數據采集方案 Psi-SynEngine。該方案由靈初智能全棧自研,包含便攜式外骨骼觸覺手套數采套裝、大規模 in the wild 數采數據管線、基于世界模型和強化學習的跨本體數據遷移模型,并已率先將采集到的人類數據應用于物流等真實場景。同時,靈初智能同步發布覆蓋視覺、語言、觸覺、動作的大規模真實世界多模態數據集 Psi-SynNet-v0。這一突破性成果標志著靈初智能全自研的真實世界具身數據引擎已經正式啟動。
![]()
相比大模型和自動駕駛,數據問題一直是困擾整個具身智能領域的痛點。行業現有的數據采集方案:
- 仿真環境數采:Sim-to-Real 差距突出,仿真分布與真實作業環境的差異,導致策略遷移退化,調參成本與場景搭建成本高。例如現有的仿真器難以仿真布料等柔性物體。
- 機器人遙操數采:數據采集難以規模化,行業呈現碎片化試點狀態,缺乏統一標準與運營機制。同時數據多樣性難以保障,雇傭專人進行數采成本過高且效率太低。且無法將世界上所有的場景、所有的物體和所有的操作都在數采場復刻,成本過大。
- UMI 設備數采:雙夾爪難以實現真實落地場景需要的精細操作,同時仍需雇傭專人進行采集,也無法在實際生產作業中同步完成數據采集。以美國勞工部的數據顯示,工廠內 98.7% 以上的工序都需要雙手多指協同完成,雙夾爪存在本質局限。
靈初智能 Psi-SynEngine 從根本上突破了上述困境,直接采集一線作業人員在真實工作中的操作數據,而非在搭建的數采場中高成本低保真度采集。采集場景覆蓋物流、工廠、商超、酒店和家庭,數據源自真實場景,無需二次遷移。
這與靈初智能從創立之初就選擇做通用靈巧操作的戰略不謀而合,相比其他硬件形式,靈巧手與人手的形態差異最小,數據遷移效率最高。
相比傳統數據采集方案,Psi-SynEngine 具有三大優勢:
- 成本低:便攜式采集設備大幅降低部署成本,數據獲取成本僅為真機遙操方案的 10%。
- 多模態高自由度:能夠完整采集觸覺、視覺、動作、語言的操作數據,保留操作細節。
- 便攜性強:可隨時隨地部署,支持大規模并行數據采集,數據采集效率相比其他方案極大提高。
這些特性使 Psi-SynEngine 成為業內首個具備真正規模化部署能力的具身數據引擎,使靈初智能能夠以前所未有的規模和速度積累真實世界具身智能數據資產。
![]()
為了讓這套具身數據引擎真正釋放價值,靈初智能構建了完整的硬件與平臺體系。由靈初智能自主研發的專為數采設計的外骨骼觸覺手套,定位精度最高能達到亞毫米級別,可完整采集手部和手臂的全部自由度和覆蓋全手的觸覺信息,同時不影響作業人員的正常操作。此外,靈初智能自主搭建了支持大規模數據處理的管線和平臺,配合自研大模型完成高精度的數據標注和后處理,形成完整的數據生產閉環。
基于 Psi-SynEngine 數據引擎,靈初智能發布的 Psi-SynNet-v0 數據集具備四大核心特征:
- 數據多樣性強:覆蓋多行業、多場景、多物體與多技能的真實操作,有效打破數據多樣性壁壘,大幅提升模型遷移與泛化能力。
- 模態覆蓋全面:完整囊括視覺、語言、觸覺、動作多維度全真值數據,為預訓練階段的模態對齊提供有力支撐。
- 數據規模海量:數據量級達到大語言模型同級水平,為具身智能的未來發展預留充足想象空間。
- 自閉環已驗證:數據體系已在靈初多個落地產業中完成閉環驗證,依托靈初強大的模型能力,確保所采集的數據能夠高度匹配算法需求,并持續推動模型迭代。
在這整套數據解決方案中,真正的關鍵并不在于硬件本身,也不在于高效的采集流程,而是如何將人類數據真正應用到機器人操作上。核心難點在于:如何彌合人手與靈巧手之間天然存在的結構與能力差異。靈初智能早在 2023 年起就開始攻關這一難題,成功實現了將人手的數據遷移到不同自由度的靈巧手上,并完成同樣的操作。同時,團隊發表了相關的論文成果和 demo。如今,這項技術被迅速工程化,發展為基于世界模型、強化學習和觸覺模態對齊的完整解決方案,能有效解決人和不同機器人之間跨本體差異的 embodiment gap,大幅提升模型泛化性和成功率。這正是靈初智能 Psi-SynEngine 真正的護城河所在。
![]()
Psi-SynEngine 數據引擎和 Psi-SynNet-v0 數據集的發布,標志著靈初智能基于人類真實操作數據的具身智能新范式正式確立,也意味著向真實世界的具身 AI 大模型預訓練擁有了可規模化的可能。依托于 Psi-SynEngine,靈初智能已在公司內部迅速構建出上萬小時規模的 Psi-SynNet-v0 數據集,并計劃于明年突破百萬小時量級,這將是全球最大的靈巧操作數據集,也將成為訓練真正具身原生大模型的核心資產。靈初智能誠邀全球研究機構與合作伙伴攜手共建 Psi-SynNet,共同開啟通用智能新時代。
關于靈初智能
靈初智能(PsiBot),作為國內具身智能科技領域的領軍企業,專注深耕通用具身智能、VLA 大模型以及靈巧操作算法等前沿技術。公司的核心團隊成員均來自頂尖高校的 AI 實驗室以及頭部科技企業,匯聚了行業內的頂尖人才。
憑借深厚的技術積累與創新能力,靈初智能成功推出了行業內首個端到端強化學習具身模型 Psi R0、R0.5 及 R1,成為行業內率先實現長程任務的具身模型研發企業,并且兼具泛化性、魯棒性、靈巧性。該成果獲得了行業頭部客戶的高度認可,目前,靈初智能正全力加速推進相關技術的商業落地進程,引領具身智能技術邁向新的發展階段。
文中視頻鏈接:https://mp.weixin.qq.com/s/JH7mfit9vaGdoFzo9SY84Q
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.