<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      刷屏的機器人,還困在「數據流水線」里

      0
      分享至

      文 | 張冰冰

      編輯 | 阿至

      后空翻、跳舞、拳擊、一腳踢碎西瓜……過去一年,這些充滿視覺沖擊力的機器人動作片段不斷刷屏。行業為之振奮,資本加速涌入,公眾的期待值也升至高點:成熟的機器人產品,似乎已從實驗室快步走向現實。

      而在被稱為機器人“學校”的數據訓練中心里,場面卻安靜得多:數據采集員手持操作設備,引導身邊的機器人完成一些看似簡單的任務,比如抓起桌上的零件,放入工具箱,再合上蓋子,動作緩慢,偶爾停頓。


      北京人形機器人數據訓練中心

      這只是“學習”的第一步。機器人每完成一組動作,就會生成一條結構化的數據。將這些數據投喂給大模型進行訓練,且數據量要足夠大,才有可能讓機器人擁有“大腦”,從而脫離被動的編程控制,邁向主動的理解與決策。用業內人士的話來說,這將是“猴子和人的區別”。

      這套“數據+算力+算法”的邏輯我們并不陌生,以ChatGPT、deepseek為代表,席卷全球的大語言模型已經驗證了其可行性,并建設了相對成熟的算力資源和算法體系。但機器人面對的挑戰在于,這次的智能從數字世界來到了物理世界,數據成為了最高的壁壘。

      大語言模型所使用的語言、圖像等數據,本質上存在于二維數字世界,易獲取、可復制;而機器人面對的三維物理世界,是一個高維、連續、多模態的時空流,包括視覺、聲音、力、扭矩、本體姿態等多種傳感器信號,處理難度指數級增長。

      如果說,互聯網多年積累的數據為大語言模型發展提供了充足的彈藥,那物理世界的數據采集和積累,幾乎需要從零開始。

      其中,“真機數據”完整采集了機器人在真實物理環境中的原始運行數據,其稀缺和可貴成為行業共識。過去一年,機器人數據采集中心以“基礎設施”的定位遍地開花,文章開頭那樣枯燥卻關鍵的數據采集場景正在全國上演。

      然而,真機訓練意味著巨量的時間與資本投入,數據中心建設“開弓沒有回頭箭”,在熱潮之下更需要冷思考:什么樣的數據才算“高質量”?訓練得到的數據如何高效流轉與復用?在填平數據鴻溝之前,行業如何務實推進?

      在機器人時代的“新基建”全面啟動之前,對這些問題的探索與解答,將決定“具身智能”是一場扎實的產業升級,還是又一個被過度透支的概念。

      一、數據采集,精工出細活

      在北京人形機器人數據訓練中心的集中訓練區,隔著透明玻璃,參觀者可以直觀地看到機器人是如何“學習”的。數據采集員將手套在采集設備上,手部的動作會傳導給一旁的機器人,讓機器人拿起桌上的鉗子、放進工具箱,再把鉗子拿出來、放進去,循環往復。

      抓、拿、取、放等簡單任務,都會在這樣的桌面環境下進行小場景訓練。再往遠處看,視線則會被白色屏風遮擋。為了防止數據污染,每個操作區都做了單獨隔間,從物理上隔絕干擾,保證數據干凈程度。

      另一邊的場景訓練區,畫面就變得復雜起來。無人超市里擺滿商品、客廳里散落著圖書、臥室和衛生間里堆放著衣服毛巾,高度還原的場景里人可以自由走動,機器人則需要在這樣復雜但更接近真實的環境中,完成物品擺放、衣物折疊等操作。


      北京人形機器人數據訓練中心場景訓練區

      從單調的初級動作訓練,到復雜的真實場景還原,目標只有一個——批量采集高質量的機器人真機數據。

      這也是所有數據中心的核心目標。

      但當前,機器人行業尚未形成統一的數據標準,不同數據采集中心往往有自己的數據表述方式和格式要求,達成目標的路徑,甚至從數據中心建設之初就開始分化。

      北京人形機器人數據訓練中心的運營方是睿爾曼智能科技(北京)有限公司,作為一家聚焦機械臂研發的機器人企業,睿爾曼對數據評估的各個維度中,對硬件的要求尤為突出。

      睿爾曼相關負責人介紹,硬件本體上,數據中心要求每個硬件本體做高精度標定,包括絕對運動精度,以及相機相關的參數等。所有機器人都裝備了高精度傳感器,可以采集多達57個維度的狀態數據。

      另一大硬件挑戰來自時空對齊。具體來說,數據采集使用的攝像頭其采樣頻率是通常是30Hz,即每秒拍攝30張圖像,拍攝每幀圖像之間的時間間隔約33毫秒,如果時間不對齊,這33毫秒的差異就會導致關節編碼器、相機、力傳感器捕捉到“不同時刻”的世界碎片。

      而模型訓練依賴嚴格的因果關聯,毫秒級的不同步就可能產生嚴重的錯位,失之毫厘謬以千里。據介紹,睿爾曼在數據采集過程中,采用硬件同步對齊策略,在硬件層面保證傳感器數據、攝像頭數據采集過程中全部按照真正的物理時刻采集,做到1毫秒以內的誤差。

      在硬件高精度標定和超時空對齊基礎上,再通過多樣性矩陣系統,實現場景物品的多樣性和機器人位置姿態的泛化性,保證不會出現數據擬合而導致模型變差的情況。再經過嚴格的數據可信度驗證,一條高質量的真機數據才算采集完成。

      睿爾曼相關負責人表示,真正能走入家庭的機器人,其真實的物理關節要足夠穩定可靠,同時要易用,并能以最小的體積發揮出最大的負載能力。在AI層面,數據維度至關重要。“我們認為真機數據是機器人走進家庭的最后一個門檻,所以我們堅定地從終局出發,提供這樣的數據資產。”

      目前,北京人形機器人數據訓練中心已實現規模化產出,每天可生成約6萬條數據,覆蓋工業智造、智慧家庭、康養服務及5G融合四大領域的16個細分場景。

      二、數據缺口與數據異構的鴻溝

      技術市場研究機構Interact Analysis數據顯示,截至 2025 年年底,中國已經有50個以上國家或省市區級人形機器人數據采集與訓練中心處于使用或規劃建設狀態,其中,50% 以上的數采中心已經在2025 年正式投入使用。

      以北京人形機器人數據訓練中心為參照,其真機數據的年產能已達千萬條級別。以此粗略計算,假設目前所有數據中心全部投入運行,機器人數據年采集量可以達到數十億條。

      這看似龐大的數據供給,在機器人所需要的“智能”面前,仍顯得杯水車薪。

      據機器人數據服務商冪特科技保守測算,在具身智能大模型足夠好且數據質量足夠高的前提下,訓練機器人學會一個動作,大概需要1000-5000條數據;訓練機器人學會一個由多個動作組成的任務,大概需要1萬-2萬條數據;訓練機器人完成某個垂直行業80%的人類工作,至少需要1億條數據;如果要把具身智能要放大到通用,也就是千行百業,那所需的數據量至少是千億條的量級,數據缺口是4-5個數量級。

      更大的鴻溝在于數據異構。因為不同廠商、不同形態的機器人在硬件設計、傳感器配置和軟件協議上各不相同,采集到的動作、力覺與視覺數據也就“語言不通”,基于一種機器人的數據成果,換到另一臺機器人上就可能失靈。

      這意味著,各個數據中心訓練的數據成果,甚至很難實現1+1=2的疊加效果。

      在行業通用的統一標準出現之前,數據中心也在探索各種不同的解決思路。

      一種是“屏蔽差異”,采用市占率較高的機械臂或機器人型號進行數據訓練,從硬件根源上規避了兼容性問題,以追求數據的更廣泛應用,比如上文提到的北京人形機器人數據訓練中心。

      另一種思路是“擁抱差異”,主動進行異構訓練。在上海張江,國家地方共建人形機器人創新中心(以下簡稱“國地中心”)具身智能訓練場,首創異構人形機器人具身智能數據集構建方法,其目標是要打造最大規模的異構人形機器人具身智能數據集。

      在這里,來自不同廠家的機器人被置于同一物理空間內協同運行。國地中心首席科學家江磊在接受媒體采訪時曾表示,“把不同廠家的異構機器人放在同一空間運行,就能讓AI意識到,它活在一個多元多樣的物理世界中,從而建立起客觀認知,發育出明辨是非的能力。”

      第三條技術路徑,是直接“繞過差異”,尋找更廣泛和通用的數據。與關節傳感器等硬件采集的數據不同,人類視頻數據對機器人來說是相對通用的,可以提取視頻數據中人體的位姿并映射為機器人的運動軌跡,繞開本體壁壘訓練大模型。


      北京人形機器人數據訓練中心視覺動作捕捉項目

      更激進的方案是直接拋開本體,進入仿真世界。在虛擬的數字化環境中,通過物理引擎和程序模擬,可以低成本地生成海量數據,再應用到真機上,實現Sim2Real。然而,物理世界的極端復雜性,從根本上決定了,仿真數據在精準性與泛化性上,難以達到理想水平。

      “我們希望能在真實與仿真之間找到一種平衡,兼具兩者的好處。”冪特科技CEO介紹了其Real2Sim2Real的數據采集模式:在虛擬環境前面增加“Human Doing Video”作為機器人學習的標本和范式,“我們將來自真實世界的人類操作的2D視頻數據做3D重建,通過仿真還原人體的3D位姿,并將3D位姿retargeting到機器人,所以我們叫Real2Sim2Real。”

      據介紹,使用這一方式,冪特科技的目標是把單條數據的成本從現在真機數據的幾十元降到幾分錢,并快速將廉價的采集設備分發到千行百業,獲得海量數據。

      三、邊“干活”邊優化

      盡管虛實結合等多種技術路徑仍在探索,但一個確定的事實是:真機數據無論占比多少,都是機器人與物理世界對齊的“最后一公里”。因此,數據訓練中心面臨的核心命題不只是追求數據規模,更在于精準生產出匹配當下產業應用剛需的高質量數據。

      在無錫,這一邏輯正在被具象化。

      由天奇自動化工程股份有限公司牽頭建設的“江蘇省具身智能機器人工業數據采集與實訓中心”,一改“樣板間”模式,高度還原了汽車整車工業場景、新能源產線應用場景及工業物流搬運場景等7大實訓場景。

      “汽車整裝是我們天奇股份的傳統的業務,我們有龐大的客戶群體以及對汽車產線場景的深刻行業理解。”天奇股份—首席算法科學家童隨兵介紹,其中汽車噴涂環節,就存在大量的機器人替代人工的需求。


      江蘇省具身智能機器人工業數據采集與實訓中心

      在汽車制造中,整車涂裝是核心工藝之一。車體在完成電泳底漆后,需進行面漆噴涂,而漆面的均勻度與完整性直接影響整車品質。傳統上,這道工序的質檢高度依賴人眼,但噴涂車間充滿揮發性化學物質,長期作業對工人健康構成一定風險。讓機器人替代人工,在此類環境中進行自動化巡檢與瑕疵識別,不僅能將工人從有害暴露中解放出來,也為實現更穩定、可追溯的質量檢測提供了可能。

      童隨兵認為,對于具身智能的機器人而言,更合理的落地方式,不是設計一個通用機器人供所有行業、所有工種使用,而是針對個性化需求設計機器人。

      基于此,江蘇省具身智能機器人工業數據采集與實訓中心構建了一個“場景-數據-模型-應用” 的閉環系統,概括說來,就是聚焦既有的業務場景,精準采集該場景機器人數據,再利用所采集的數據訓練自研的具身智能大模型,并將訓練好的模型部署回對應的實際生產環境中。最終,在真實場景中驗證并迭代。

      真實場景不僅是數據和大模型效果的“試金石”,也有望成為高質量數據的來源。

      2026 CES上,睿爾曼完成了從“北京—拉斯維加斯”的跨洋實時作業演示。通過構建遠程勞動力網絡,北京的具身訓練師可遠程控制遠在CES展臺的RealBOT輪式折疊機器人,執行“遞送物品”“傳遞水果”等真實場景作業。

      這不僅是解決特定場景用工需求的方案,更關鍵的是,讓機器人在真實的作業流中直接積累數據。每一次遠程操作,都在同步生成包含環境交互、人力決策和任務結果數據,實現了“工作即采集”。這意味著,未來的數據工廠可能無需完全復刻場景,而是可以直接接入全球的生產線和服務終端,讓數據在真實的運轉中自然沉淀。

      四、一場更復雜的耐力賽

      同樣是“基礎設施”的定位,人形機器人數據訓練中心,遠比單純的智算中心復雜。不能靠簡單的“堆砌”,而是一個以數據驅動、軟硬一體、場景閉環的新型基礎設施。

      在業內專家張曉宇博士看來,評價一個數據中心的未來潛力,核心在于其“異構數據閉環能力” 。這可以拆解為三個關鍵問題:

      第一,能否將工廠、倉庫、實驗室等真實物理場景,通過標準化接口便捷地接入數據中心,形成持續的“數據脈動”?

      第二,能否建立一套從多模態數據采集、云端標注訓練、到模型部署回機器人的完整技術管線,并讓數據在不同機器人本體間像軟件一樣復用?

      第三,是否擁有一個強大的仿真平臺,能基于有限的真實數據,生成海量合成數據進行安全、低成本的“百萬次測試”,加速迭代?

      以上都是未來各地方區域在數據中心建設中可以探討的技術方向。

      技術之外,張曉宇認為,數據中心還依賴于它所根植的產業土壤,需要明確的主導產業作為需求引擎,催生有價值的數據,“高質量數據集對于模型訓練的重要性不言而喻,但從數采場本身的經濟性出發,為每一個機器人品牌都單獨建一個數采場是不合理的,最合理的方式應該是在一個工業類或高校比較集中的城市只建一個數采場,采集標注并清洗后的高質量數據集可以提供給多個機器人廠家使用,從而實現’一次投入,反復使用’的杠桿效應。”

      機器人數據中心的落地堪比大規模的生態建設,政策支持、法規環境、人才培養缺一不可,數據訓練之外,還希望實現吸引企業聚集,促進行業模型迭代,加速機器人企業共同發展。

      最終,這一切基礎設施的意義在于,讓高質量的機器人數據,能像電流一樣順暢地輸送到每一個需要它的算法與機器人公司手中。

      為此,行業已經開始探索多元化數據交易和應用模式:2025年8月,帕西尼具身智能超級數據工廠產品“OmniSharing DB 帕西尼全模態具身智能數據集”,在北京國際大數據交易所正式上架;10月,帕西尼攜手騰訊云達成戰略合作,將共同打造具身智能 “數據云商城” ;天奇股份也將基于“江蘇省具身智能機器人工業數據采集與實訓中心”構建數據平臺,讓機器人數據如同今天的云資源一樣,成為服務于整體行業的基礎資源。


      江蘇省具身智能機器人工業數據采集與實訓中心

      在理解機器人數據采集與產業落地的溝通中,一個案例被反復提及,作為參照的坐標,那就是智能駕駛。行業內部形成了一種清醒的共識:智能駕駛的賽道相對清晰——遵循既定的公路網絡,依賴已高度成熟的汽車和傳感器硬件,其核心任務簡化為在結構化環境中進行可靠的感知與決策,核心是“避免碰撞”。

      即便如此,這項技術歷經十余年攀登,商業化落地也僅是近期才觸及L3級輔助駕駛的門檻,開始進行有限測試。

      相比之下,具身智能機器人的落地難度指數級增加。

      數據中心的快速建設,解決的更多是“訓練資料”的規模化生產問題,但這本“教材”的完備程度、以及機器人的“大腦”與“身體”能否高效學習并應用,仍是懸而未決的命題。智能駕駛的故事已經表明,一項復雜技術從實驗室演示到穩定、可靠、經濟的商業產品,其間需要穿越的“死亡谷”遠比想象中漫長。

      對于機器人而言,這場穿越周期的耐力賽,考驗才剛剛開始。

      36氪未來產業

      「36氪未來產業」持續關注城市發展、產業轉型和創新創業項目落地。尋求報道可郵箱聯系wangfengzhi@36kr.com或掃碼聯系。

      此外,今年36氪正式推出《36氪企業投資指南內參》,依托在經濟圈產業群、區域重點推進規劃與招商領域的深厚積累,36氪通過提供深入詳細、更為及時、獨家專有的全面信息服務,為政府部門提供高效、精準的產業項目內參;助力項目方匹配產業資金、鏈接關鍵人脈、快速融入新的產業生態。


      本文來自微信公眾號“36氪未來產業”,作者:張冰冰,阿至,36氪經授權發布。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      79年,特科一科長拜訪顧順章獨女,含淚道歉:是我親手殺了你母親

      79年,特科一科長拜訪顧順章獨女,含淚道歉:是我親手殺了你母親

      潯陽咸魚
      2026-02-11 13:15:10
      黃多多留學近況曝光,“三通一達”新梗引發熱議

      黃多多留學近況曝光,“三通一達”新梗引發熱議

      靜若梨花
      2026-01-29 00:10:05
      徐湖平父親和岳父身份被扒!個個不簡單,難怪舉報他4次都不成功

      徐湖平父親和岳父身份被扒!個個不簡單,難怪舉報他4次都不成功

      詩意世界
      2025-12-31 16:43:19
      陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

      陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

      好賢觀史記
      2025-11-09 21:58:39
      妹妹年終獎只有8000,項目組其他人都是18萬,她全程沒吭聲

      妹妹年終獎只有8000,項目組其他人都是18萬,她全程沒吭聲

      小秋情感說
      2026-02-11 09:39:42
      臺積電明說了:只要是在日本和美國制造的芯片,漲價10-30%很正常

      臺積電明說了:只要是在日本和美國制造的芯片,漲價10-30%很正常

      現代小青青慕慕
      2026-02-10 21:15:13
      馬云馬化騰現身壓陣大模型,互聯網格局重回20年前?

      馬云馬化騰現身壓陣大模型,互聯網格局重回20年前?

      BT財經
      2026-02-11 07:00:03
      從海南打車到哈爾濱后續:最后結算了3萬元,還送了司機很多禮物

      從海南打車到哈爾濱后續:最后結算了3萬元,還送了司機很多禮物

      墜入二次元的海洋
      2026-02-11 12:33:40
      有兒子的家庭集體覺醒:寧讓兒子單著,不娶“祖宗”進門

      有兒子的家庭集體覺醒:寧讓兒子單著,不娶“祖宗”進門

      青蘋果sht
      2026-02-08 05:48:26
      炸穿美國政壇!愛潑斯坦文件解密,紐約新市長生父竟是他?

      炸穿美國政壇!愛潑斯坦文件解密,紐約新市長生父竟是他?

      老馬拉車莫少裝
      2026-02-01 21:57:22
      800萬伊朗人靠體制吃飯

      800萬伊朗人靠體制吃飯

      桂系007
      2026-02-07 23:58:05
      父親分拆遷款給弟480萬,只給我10萬,我剛要走他攔下:話沒說完

      父親分拆遷款給弟480萬,只給我10萬,我剛要走他攔下:話沒說完

      曉艾故事匯
      2025-11-19 08:06:37
      向華強最害怕的事:不是向佐在娛樂圈丟臉,而是新聞有向佑的名字

      向華強最害怕的事:不是向佐在娛樂圈丟臉,而是新聞有向佑的名字

      小熊侃史
      2026-02-11 12:51:10
      馮小剛女兒徐朵約會男生曝光!見媽媽徐帆氣氛好,男生高大帥氣

      馮小剛女兒徐朵約會男生曝光!見媽媽徐帆氣氛好,男生高大帥氣

      暖心萌阿菇涼
      2026-02-10 21:28:52
      演員王陽明隨妻子回娘家澳洲過年,一家三口同框,蔡詩蕓氣質真好

      演員王陽明隨妻子回娘家澳洲過年,一家三口同框,蔡詩蕓氣質真好

      眼底星碎
      2026-02-11 08:49:38
      哥哥是皇帝,大伯是光緒,奶奶是慈禧,他卻非常低調地活到2015年

      哥哥是皇帝,大伯是光緒,奶奶是慈禧,他卻非常低調地活到2015年

      法老不說教
      2026-02-10 12:39:27
      近代日本為什么能反超中國?是日本人更優秀?不,重點在這2項

      近代日本為什么能反超中國?是日本人更優秀?不,重點在這2項

      老范談史
      2026-01-21 21:24:58
      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      談史論天地
      2026-01-23 10:04:14
      利物浦狂喜?曼聯切爾西翻車+遭保級隊狙擊!爭歐冠資格希望重燃

      利物浦狂喜?曼聯切爾西翻車+遭保級隊狙擊!爭歐冠資格希望重燃

      我愛英超
      2026-02-11 06:32:04
      為什么1.8米的床退出中國家庭?過來人說出實情,幸虧沒選錯!

      為什么1.8米的床退出中國家庭?過來人說出實情,幸虧沒選錯!

      家居設計師蘇哥
      2026-01-19 14:25:20
      2026-02-11 13:52:49
      36氪 incentive-icons
      36氪
      讓一部分人先看到未來
      150633文章數 2848043關注度
      往期回顧 全部

      科技要聞

      痛失兩位華裔大佬!馬斯克為何留不住人心

      頭條要聞

      媒體:俄外長突然放下狠話 令人感覺到一陣陣寒意

      頭條要聞

      媒體:俄外長突然放下狠話 令人感覺到一陣陣寒意

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      汪峰吃驚!章子怡年前6天高調官宣喜訊

      財經要聞

      習酒節前價格雪崩控量穩價變空談

      汽車要聞

      新款阿維塔12內飾官圖:全面升級 兼顧智能與豪華

      態度原創

      數碼
      家居
      游戲
      藝術
      教育

      數碼要聞

      中國好屏,標準為尺:全球顯示迎來“中國時刻”

      家居要聞

      簡雅閑居 靜享時光柔

      值得期待!外媒盤點索尼新游戲發布會每款都是重量級

      藝術要聞

      楷書進步緩慢的原因是什么?

      教育要聞

      中考高考沒有了,就公平了嗎?很多人不敢細想這個問題

      無障礙瀏覽 進入關懷版