作者:呂鑫燚 編輯:狄鑫彤 出品:具身研習社
看完WAIC的現場才驚覺,馬斯克剛開的特斯拉超級充電餐廳還是保守了。
在WAIC在大會核心的"智能服務機器人技能大比拼"中央展區,具身研習社實地感受了擎朗機器人XMAN-F1絲滑又貼心的服務。
XMAN-F1能絲滑的完成爆米花的制作,還能調制各類冰鎮飲料。例如,接收到觀眾需求后,XMAN-F1會開始分析訂單內容,然后按需制作。精準識別面前的材料并穩穩拿取所需要的物體。無論是傾倒飲料還是加入冰塊,整個執行流程不僅絲滑無阻,還與人類工作者的動作邏輯與姿態相差無異。
![]()
圖片來源:擎朗智能
據具身研習社了解,XMAN-F1是擎朗智能基于海量場景數據積累,推出的最新一款雙足人形機器人,雙足形態的下半身和優異的運動控制算法結合,使其不僅能突破平面移動限制,還具備樓梯、斜坡、崎嶇地面等復雜地形中的移動能力。透過WAIC現場的實景作業能力可見,XMAN-F1雖然“初出茅廬”但其能力并不遜色。
雙足形態的XMAN-F1,進一步完善了擎朗智能多形態機器人協作生態。在擎朗智能的展臺中,XMAN系列人形機器人調酒后,由擎朗配送機器人T10按最優路徑完成配送。當觀眾從協同配合的機器人手中接過一杯酒時,人形機器人在服務場景中的落地價值也得到了直觀驗證。
或許,服務場景才是人形機器人最大效用的承接地。
好用、賦能、反哺
服務場景的三大掘金點
人形機器人進化中始終有這一條樸素的邏輯:先以好用的產品賦能場景升級,再在場景中收集真實數據進而反哺技術發展,造出更好用的新產品,進而形成良性發展閉環。
在這其中,場景的選擇至關重要,其需具備“真實需求-場景價值”兩大核心要素。從落地場景來看,目前更契合的場景為工業和商業服務。但前者還存在客觀桎梏,雖然工業場景中結構化環境和標準化流程的特性更適合現階段人形機器人技術落地,但部分企業認為工業場景的重復性勞動,不足以“練腦”,大腦需要在復雜環境和高動態環境中進行訓練。
相比之下,商業場景的復雜性與交互深度,恰恰是人形機器人得以最大化釋放的核心價值領域。尤其是商業領域下的服務場景,其動態人流中的即時響應、非標準化物品的靈巧操作、以及與人類環境的無縫交互,均構成了更具挑戰性也更有價值的應用場域。
![]()
圖片來源:擎朗智能
其一,在復雜高動態環境中“練起來”。
服務場景頗具訓練價值點,該最大的特點為,非結構化的環境配以高頻次的交互,前者能在充滿不確定性因素中,訓練感知-決策-執行閉環的能力;后者有助于提升人形機器人自然語言處理、情感交互、任務執行等能力。
其二,生產力價值可被量化。
商業場景中大多數人形機器人被用于展覽、引流、導覽等工作崗位,雖然能為場景帶來新鮮感,但上述崗位的生產力價值難以轉化為可測量的經濟收益,成為規模化落地的隱性阻礙。而服務場景中的收配餐、飲品調制等任務,天然具備工時節約、坪效提升等可測算指標,使客戶能夠清晰核算投入產出比,這本質是ROI驅動的商業決策,為規模化鋪平道路。
其三,釋放協同價值。
多年來服務場景早已大規模應用各形態機器人,以擎朗智能為例,其已在全球累計部署超10萬臺機器人,覆蓋餐飲、酒店、清潔、醫療等多個領域。當其他形態的服務機器人和人形機器人共同出現在服務場景中,可以形成多形態協作,釋放實現“1+1>2”的系統級效能躍升。
人形機器人的終極價值,終將在技術與場景的深度咬合中得以釋放。服務場景所具備的復雜環境、真實交互與可量化收益三重特性,不僅為技術迭代提供了高價值數據燃料,更通過切實的商業閉環驗證其存在必要性。
當更多像擎朗智能這樣的企業,以務實態度將人形機器人錨定于可創造真實效益的服務節點,而非停留于概念演示,這條“產品-場景-數據-進化”的飛輪方能加速運轉,這或許正是打開人形機器人規模化未來的密鑰。
服務場景需要什么能力?
當服務場景兼具商業價值承載與技術淬煉場雙重屬性時,其對入局者提出了更高維度的要求:不僅需要底層技術攻堅能力,更需具備深度解讀“場景語言”的翻譯能力。這具體體現為兩個核心素養:垂直場景的認知穿透力,以及本體結構與場景需求的精準耦合能力。
因此,深度積累的場景認知穿透力,已成為機器人企業解構真實需求的關鍵壁壘。唯有長期深耕垂直場景的參與者,方能精準“翻譯”場景隱含的業務邏輯語言。例如,在跨工序作業中(如餐廳場景的“配餐-送餐-收餐”閉環),自主規劃空間動線最優軌跡;基于對場景SOP的深度理解,規劃操作序列。
![]()
圖片來源:擎朗智能
尤其在餐廳、醫院、酒店等高擾動非結構化場景中,對人形機器人的魯棒性和避障能力提出了高要求,這正是深耕者通過海量場景數據迭代出的核心優勢。全球領先的IT市場研究和咨詢機構國際數據公司(IDC)最新報告顯示,擎朗智能出貨量占比位居全球商用服務機器人第一。市占率的背后標志著,擎朗智能擁有絕對的真實數據優勢,據了解,擎朗智能每日產生數億條真實場景數據。
基于移動機器人多年深耕積累真實數據,擎朗智能已經研發出更懂場景的“大腦”,和更適配的架構。擎朗智能具身智能架構,構建了"場景層-垂域模型層-通用大模型層"的級聯架構,形成從具體場景需求到通用能力支撐的正向反饋循環。
![]()
圖片來源:擎朗智能
場景層覆蓋餐飲、酒店、零售等領域的場景知識庫,每個場景都被分解為可量化的崗位指標;垂域模型層集成了不同崗位的原子技能庫,抓取、放置、端持、沖泡等基礎動作和專業化技能。通過“搭積木”的模式自由組合,快速適配新場景形成可復用的服務模式庫;通用大模型層,通過“視覺-語言-動作”一體化端到端大模型,提供跨場景的基礎能力。
簡單來說,擎朗智能構建了一個既懂場景,又知道如何干活的“大腦”。
此外,服務場景是一個注重“人效”的場域,通常一個服務人員需要兼任多種工作任務。如同時負責多位顧客的接待、送餐、收餐等全流程服務。真實場景的作業流程要求人形機器人不能是單一技能工而是能完成全鏈條的操作。
據具身研習社了解。通過結合通用大模型提供跨場景基礎能力,XMAN-F1實現了完成對應服務場景內“點單-配餐-送餐-收餐等長任務閉環,并具備復雜任務理解與長程規劃決策的能力,未來將去向更多場景任務探索。
XMAN-F1還能和擎朗旗下其他機器人協同,比如在餐廳,XMAN-F1可以充當酒保角色,調酒后將餐品交接給擎朗配送機器人,按最優路徑依次給顧客送餐;在酒店里,XMAN-F1可以做禮賓員,也可與清潔機器人協同,一起完成客房清潔任務,進一步完善擎朗多形態機器人協作生態。
![]()
圖片來源:擎朗智能
值得一提的是,該協作生態,不僅大幅提升了任務執行效率,更建立了數據共享和持續優化的智能生態,機器人的運行數據將反哺至擎朗具身模型,從而推動整個整個擎朗多形態家族不斷進化。
![]()
圖片來源:擎朗智能
這種跨形態的能力耦合和“滾雪球”式迭代,標志著服務機器人從單機智能邁向系統級效能躍升的新階段。
要好用更要長期用
評判標準是關鍵
大模型訓練時為了讓其輸出答案更精準,需要“獎勵機制”的來扶正每一次回答。人形機器人落地應用時,想要走得更遠,完成長效發展,也同樣需要一個“獎勵機制”,用于規范其操作標準化。
為此,擎朗智能給出的解法是,機器人“崗位化”發展理念。通過崗位規范化流程,讓具身服務機器人的工作內容可以被精確的描述,結果可以被標準化評估,這將更有利于在商業環境形成機器人能力的閉環。
![]()
圖片來源:擎朗智能
舉個例子,就像公司員工的季度考核一下,員工工作能力好不好不是領導的主觀臆斷,而是有完整的客觀評判體系。不僅有利于領導評估每位員工的工作能力,也給員工向上發展提供了清晰的進化目標。
人形機器人的落地應用也需要類似的考核標準,這就是擎朗智能提出“崗位化”的初心之一。一來,給機人形機器人制定一套評判、進化的標準,敦促能力迭代;二來,也能讓終端客戶切實感受到人形機器人帶來的提質增效,增強用戶的感知度。
其次,通過不斷的復制“崗位化”工作模式過程,擎朗人形具身服務機器人將不斷學習和拓展多樣化工作能力,持續增強基礎動作模型能力。此外,崗位化能帶來任務明確性和技能復用性,使機器人能夠做到"舉一反三",進一步提升泛化性,從而實現更廣泛的落地場景應用。
這也和人類工作者在職場晉升的邏輯相同,從基層崗位做起,逐步輪崗成長為多面手,每掌握一個新崗位,增加了新服務能力,還能為通用模型提供了新的訓練維度。
擎朗智能提出的崗位化,可以視為“服務生產力革命”的底層價值觀:當人形機器人像職場精英般通過標準化考核獲得“能力認證”,當清潔效率等指標如同財務報表般清晰可查,標志著人形機器擁有了價值標尺。而擎朗埋下的更深伏筆是,讓機器人真正理解“把一件事做對”意味著什么。
正如工業革命用標準螺紋件實現機械互聯,擎朗的崗位化正在編織機器服務能力的通用語言。這或許比任何單點技術突破都更接近本質:只有當機器人學會在規則中進化,才能收獲真正的生產力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.