![]()
具身機器人,終于能干“細活”了。
作者丨高景輝
編輯丨馬曉寧
今年上海AWE展會的現場,最火的關鍵詞莫過于“機器人”。無論是人形機器人跳舞、搏擊,還是四足機器人爬坡、越障,都賺足了現場觀眾的目光。
但與一眾靠表演出圈的機器人展位不同,它石智航在展臺現場有一場別開生面的儀式——3月12日上午,吉尼斯世界紀錄認證官在它石智航展位,為其頒發了“機器人在一小時內裝配亞毫米級線束最多次數”的吉尼斯世界紀錄證書。
![]()
在3月10日,它石A1機器人在1小時內,完成了超百次0.5mm2的精細柔性線束完整裝配任務,最終以超過挑戰要求次數50%以上的最終成績,拿下了這項中國具身智能在工業精密操作領域的首個吉尼斯世界紀錄。
![]()
這項挑戰,素來被稱作工業自動化界的 “哥德巴赫猜想”,需要攻克柔性線束易變形難建模、亞毫米級接口對位精度要求嚴苛、插拔力控容錯率極低、長時重復作業穩定性難保障等多個長期困擾行業的難題。
而它石智航之所以能挑戰成功,主要歸功于它石自研的通用具身大模型「AWE3.0」。該模型的能力具有“走出溫室、落地干活、通用泛化”的特點,在亞毫米級精度操作、柔性物體感知控制、長程任務穩定執行、跨場景遷移等方面都實現了突破。
這意味著,這項世界紀錄的誕生不是一次偶然,而是技術進步下的必然,同時也揭示了一項令人興奮的事實:具身機器人面向真實產業場景的 “干活” 能力,終于迎來了里程碑式的突破。
01
工業自動化界哥德巴赫猜想,被它石解決了
過去幾年,大眾對機器人的認知,大多來自各類出圈的名場面:能完成高難度跑酷、整齊舞蹈的人形機器人,能爬樓梯、翻越障礙的四足機器人……這些令人驚嘆的表現,本質上考驗的都是機器人的“locomotion(運動)”能力。
運動能力的核心,是機器人對自身硬件結構的精準控制,哪怕是動態環境下的避障與動作調整,本質上也是對自身運動軌跡的優化,大多基于預設的動作模型與場景邊界完成優化。但對工業場景而言,真正能轉化為生產力的,是“manipulation(操作)”能力。
這兩種能力的難度有著本質區別。如果說運動能力是機器人“管好自己的身體”,那操作能力就是讓機器人“改變外部世界”,后者需要的技術遠比前者復雜,就像行走對于絕大多數動物都很簡單,但能使用工具的只有靈長類等少數幾個物種。
這也是為什么,當前已經實現規模化落地的工業機器人,大多只能完成碼垛、上下料等簡單的剛性物體操作,面對需要精細控制、柔性適配的復雜工序,始終難以突破。而線束裝配,正是工業自動化領域公認最難啃的硬骨頭之一,甚至被稱作工業自動化界的 “哥德巴赫猜想”。
什么是線束裝配?通俗來說,就是工業場景里的“極限穿針引線”。機器人需要拿取極易變形的柔性線束,將插頭精準穿過端子,再插入間隙同樣為亞毫米級的對應接口中,全程必須滿足嚴苛的精度與力控要求,才算一次有效裝配。
對工業生產而言,這是一道繞不開的剛需工序——小到手機、電腦等 3C 產品,大到汽車、飛機、高鐵,幾乎所有帶電的工業產品,都離不開線束裝配。
但就是這道基礎工序,長期以來幾乎完全依賴人工,因為其背后的技術難點,幾乎戳中了傳統工業機器人的所有能力盲區。
首先是柔性物體的不可控性,線束沒有固定形態,拿取、移動過程中隨時會發生彎曲、扭轉,無法像剛性零件一樣精準建模,傳統機器人根本無法預判和應對這種隨機形變。其次是亞毫米級的極致精度要求,接口間隙達到亞毫米級,需要視覺定位、力覺感知、軌跡規劃實現微米級的協同,稍有偏差就會導致裝配失敗,甚至損壞元器件。
同時,這項工序對力控的平衡要求極高,插拔過程中,力度過小無法完成裝配,力度過大則會撞壞端子,必須在極窄的范圍內實現力度的精準控制。更重要的是,工業生產需要的不是一次兩次的成功,而是長周期重復作業的穩定性,一小時內上百次重復操作,如何控制誤差累積、避免動作卡頓抖動,對機器人的控制系統是極致考驗。
也正因如此,線束裝配行業長期面臨著招工難、人力成本高、人員流失快的困境 —— 即便是熟練工人,也需要經過 3-6 個月的專業培訓才能上崗,而高強度、高重復度的工作屬性,讓行業年輕工人的流失率居高不下。
它石 A1 機器人這次的挑戰,證明了這個困擾行業多年的難題,終于迎來了可落地的智能解法。更關鍵的是,本次挑戰的場景是對真實工業線束場景的1:1復刻,而非為了沖紀錄定制的特殊環境,這意味著這項技術能力,具備直接走進工廠生產線的落地基礎。
![]()
02
它石細活背后,是AWE模型持續進化
要完成這樣高難度的連續精密操作,從來不是靠單一硬件的升級,而是需要一套完整的、能適配真實工業場景的具身智能體系。它石智航的核心底氣,正是由首席科學家丁文超博士日前正式發布的全球首個能干活的通用具身大模型AWE3.0。
![]()
機器人要完成精準操作,第一步是要真正 “看懂” 并 “預判” 所處的世界,而不是像傳統視覺方案一樣,一幀一幀地重新理解畫面。AWE3.0 繼承并優化了兼顧實時性與精度的世界表征能力,通過自研的世界分詞器,將視覺、觸覺、本體感覺等多模態傳感器輸入,轉化為結構化的緊湊世界狀態,為機器人構建了一個持續更新的4D “數字化世界沙盤”。這個沙盤不會隨著畫面幀的切換重置認知,而是能持續保留對場景的理解,不僅能精準感知物體的位置與形態,更能預測其運動和相互作用的結果,提前規劃動作路徑。
在線束裝配的過程中,這意味著機器人能實時預判線束的形變,同步調整動作,而非等偏差出現后再被動修正。數據顯示,AWE的空間描述精度超過行業基準21%,推理速度達到行業基準的2.21倍,有效解決了工業場景對精度與實時性的雙重剛需。
看懂了物體的位置,還需要理解交互的邏輯。線束裝配的核心難點,從來不止是 “看得準”,更是 “控得住力”。傳統的機器人方案里,視覺定位和力控往往是分離的模塊,很難實現深度協同,而AWE3.0在統一的模型架構內,實現了空間理解與物理推理的深度融合。
一方面,憑借持久、視角一致的世界表征,系統能在視角變化下保持穩定的空間理解,精準鎖定接口的三維位置;另一方面,世界狀態集成了觸覺與接觸信息,使模型能精準推理接觸動力學,基于預測的接觸結果生成動作,而非依賴被動的反應式控制。就像熟練的產業工人,眼睛看準位置的同時,手上已經預判了插拔需要的力道,一氣呵成完成裝配,這正是具身智能感知-推理-行動閉環深度融合的體現。
真實的工廠環境,永遠不可能和實驗室的訓練場景完全一致。生產線的布局、設備的安裝角度、工位的光照條件,都會發生變化,傳統工業機器人往往需要為每一個工位做定制化調試,落地成本高、周期長,這也是精密操作自動化難以規模化推廣的重要原因。
而AWE3.0實現了決策邏輯的重要升級,基于它石全視角通感決策OSD(Omni-Sense Decision),模型推理不再直接依賴有限的相機視角,而是基于構建的世界狀態進行決策。哪怕面對訓練中從未見過的全新視角,系統也能通過對世界狀態的推理,生成穩定的執行動作。在RLBench基準測試中,這種能力讓機器人在未見視角下的任務成功率提升了 3倍,大大降低了場景適配的成本,讓機器人真正具備了規模化工業應用的泛化能力。
![]()
AWE3.0 的精細操作能力,離不開它石WIYH數據集的爆發式增長——目前該數據集已積累超百萬小時的具身數據,覆蓋了六大類工業操作的接觸模式。基于這些數據,它石打造了視覺-觸覺世界動作框架 OmniVTA,讓AWE3.0能以30Hz的頻率產生細粒度動作,實時感知接觸狀態的變化并快速響應調整。正是這種極致的感知與控制能力,讓機器人能駕馭柔性線束的亞毫米級裝配,攻克了傳統機器人無法突破的精細操作壁壘。
值得一提的是,在成立之初,它石智航就提出了“Human-centric”(以人為中心)的數據采集新范式,填補了具身智能所需的高質量、可泛化、大規模真實世界數據的空白,為具身基座模型實現Scaling Law提供了關鍵語料。丁文超博士日前在發布AWE模型時也解釋,“什么樣的數據才能讓機器人真正懂物理世界?我們認為Human Centric數據才是唯一解,而不是用遙操或仿真數據得到一個頭重腳輕、不能在真實復雜環境用的VLA模型。”
![]()
當然,一次裝配成功不難,難的是一小時內上百次連續操作都能保持穩定與流暢。工業生產最怕的,就是機器人動作卡頓、軌跡抖動,不僅會影響產品良率,長期作業還會出現嚴重的誤差累積。針對傳統機器人異步推理導致的動作不連續問題,AWE3.0提出了隱空間重用再細化動作策略(RTR),通過“預判+微調”的機制,在隱動作空間中保留上一動作的剩余部分,并用新推理的潛在動作進行微調,有效消除了動作塊切換時的跳變與卡頓。
測試數據顯示,這項技術讓機器人的動作軌跡抖動降低超過45%,讓動作執行更連續、更絲滑。同時,結合世界對齊的隱動作空間,系統不僅能實現毫米級的執行精度,還具備從接近失敗的狀態中自動恢復的能力,哪怕線束出現意外形變,也能及時調整修正,保障了長周期作業的穩定性與一致性。
03
它石智航的一小步,具身智能落地的一大步
它石智航這一項吉尼斯世界紀錄的背后,并不只是技術參數的突破,而是整個具身智能行業發展方向的重要校準,是中國高端制造業智能化升級的關鍵一步。
從技術維度看,這次突破重新定義了具身智能的核心價值。長久以來,全球具身智能行業都陷入了“炫技誤區”,各家企業紛紛比拼機器人的運動極限,卻忽略了具身智能的終極使命——成為能替代人工、創造價值的生產力。
它石這次的挑戰,恰恰回歸了這個最樸素的本質。超百次有效裝配,是可重復、可驗證、可交付的工業化能力,標志著中國的通用具身大模型,已經真正實現了從“理解世界”到“改造世界”的跨越,讓具身智能的發展,從“比誰更能演”轉向了“比誰更能干”。更值得一提的是,這項技術填補了行業的用工缺口。機器人接過這些重復性工作,恰恰能緩解行業用工壓力,推動制造業向更高附加值的方向升級。
從產業維度看,這次突破為制造業的共性痛點提供了真實解法。線束裝配是制造業的基礎共性工序,小到手機、電腦等3C產品,大到汽車、飛機、高鐵,每一件工業產品的生產都離不開這道環節。這個千億級的賽道,長期被人工依賴的痛點困住,自動化率始終處于極低水平。
從宏觀維度看,這次突破是中國新質生產力在高端制造領域的具象化體現,更是中國在全球具身智能賽道搶占制高點的重要標志。
從實驗室的技術突破,到工廠里的落地實干,從來都是科技產業最難跨越的一道鴻溝。它石智航用一項吉尼斯世界紀錄,證明了中國具身智能已經跨過了這道鴻溝。當機器人真正學會了“干細活”,當通用具身大模型真正走進了千行百業,我們終將看到,科技創新如何真正驅動產業變革,為中國制造業的高端化、智能化升級,注入源源不斷的新動能。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.