![]()
當大多數機器人仍在演示跳舞時,一批"沉默干活"的機器人已悄然走進工廠與酒店——這恰是2025年具身智能領域最深刻的分野。
在火星加速器創始人陳亮主持的這場CES圓桌中,靈御智能CEO金戈、途靈科技創始人楊章欣、HTC VIVE機器人業務負責人Jase Qiang與聯想創投史晨星達成共識:2026年將成為操作型機器人商業化落地元年。![]()
陳亮 火星加速器創始人
在過去八年時間里組建了國內最大的具身機器人創始人社區,囊括超500位機器人方向創始人。![]()
金戈 靈御智能創始人兼CEO
靈御智能的核心產品是輪式雙臂靈巧末端機器人,主要采用"遙操作+人機混合智能"方案服務各行各業客戶,通過實際工作持續獲取數據,最終實現機器人自主工作。![]()
楊章欣 途靈科技創始人
途靈科技專注于用AI技術賦能酒店行業,為海外酒店提供分銷和AI軟硬件配套服務,業務覆蓋15個國家。
![]()
Jase Qiang VIVE Robotics創始成員
VIVE Robotics是HTC子公司,專注于機器人領域,核心業務是真實場景的數據采集,利用長期積累的硬件經驗和高精度多模態數據采集能力,解決機器人領域最關鍵的數據問題。![]()
史晨星 聯想創投
聯想創投作為聯想集團的CVC,在具身智能領域已投資40多家企業。若將具身智能狹義定義為機器人,聯想創投應是市場投資最多的機構。但內部將具身智能范疇擴展為AI+硬科技,包括汽車自動駕駛、各類機器人及場館中的AI硬件。
以下為圓桌實錄,略有刪減:
陳亮:回歸今天的主題"從實驗室到生活間",主要探討具身智能的落地與生態構建。過去一年,國內具身智能與機器人領域進展迅速,年初時機器人僅能初步實現行走功能,而到年底已能參加各類熱門演唱會。這背后涉及多維度的技術突破,今天我們對此進行深入探討。
第一個問題想問金戈。你們選擇了一條獨特的路線,當行業普遍追求AI驅動智能機器人時,你們選擇了遙操作模式——先通過遙操作實現作業,未來再過渡到全AI操控。選擇這一路線是否意味著對短期內實現純AI驅動持謹慎態度?
金戈:應如此理解——短期內實現通用人工智能機器人確實不容樂觀,但通過人機混合智能方式為各行業提供服務,我非常樂觀,這也是當前極為有效的路徑之一。
回顧自動駕駛發展歷程,其本質是典型的人機混合智能系統,逐步減少人為干預、增加機器自主比例,通過線性提升最終實現自動駕駛。即便當下,部分L4級自動駕駛企業仍配備遠程人類安全員進行兜底,這同樣屬于人機混合智能解決方案。
目前機器人模型或AI驅動面臨的最大挑戰是數據量完全不足以支撐高泛化、高性能、高可靠性的解決方案。因此,純AI驅動的機器人當前仍顯得笨拙緩慢,無法真正投入實際使用。
但當引入人機混合智能,以人類遙操作進行兜底時,諸多問題便可解決。首先,遙操作可應對危險環境作業,解決不同國家間的勞動力價差問題,這些均為真實存在且可規模化收集場景數據的領域。將這些真實數據回傳用于模型訓練,成果在可靠性與泛化性上將更具價值。我們認為這是最快實現具身智能在各行業落地的解決方案。
回歸最初問題,可置于任意場景立即自主工作的具身機器人可能尚需時日,但在酒店、餐飲或工業場景中的非流水線上下料環節,人形機器人的應用可能很快實現。
陳亮:當前遙操作落地情況如何?
金戈:從性能與操作能力看,目前只能完成基礎性操作任務,如清潔搬運、物流分揀及部分拾取放置任務。盡管存在效率損耗,但根據測算仍具備相當的財務收益。
回顧互聯網出現時催生了呼叫中心(call center)。互聯網使語音服務突破地域限制,呼叫中心迅速將發達國家昂貴的接線員崗位轉移至勞動力成本較低的地區,同時將原本分散在各門店的客服人員集中管理,進一步強化了大型企業的規模效應與人力效率。
如今,遙操作使"操作"行為得以跨越物理距離,我們或許會見證新型操作中心(operation center)的誕生。一方面將任務從高勞動力成本地區轉移至低成本地區,另一方面將分散在各門店的基層操作人員集中管理,用少量人力為多個門店的機器人提供兜底方案。這可能是未來三五年內迅速發生的變革。
陳亮:這種遠程異地特性會帶來哪些挑戰與障礙?目前解決程度如何?
金戈:核心挑戰在于帶寬、延遲及網絡穩定性。基礎設施建設持續完善,國內正與移動、聯通探討6G可能性,全球對互聯網帶寬需求持續增長。在帶寬滿足的前提下,延遲僅受物理距離與光速限制。若能實現穩定低延遲、低丟包的操作,目前2000公里范圍內均可保持良好穩定性。隨著新一代通信技術與基礎設施更新,機器人遙操作市場需求爆發將加速基礎設施建設,二者相輔相成共同提升。
陳亮:你定義的遙操作未來形態是1對1還是1對多?類似robotaxi模式,一人管理多臺?
金戈:應為1對多關系,類似robotaxi的少量人類兜底方案。當前已可實現1對多管理,例如酒店送餐機器人在導航方面已非常完善,該階段完全無需人類接管,僅在需與客人交互時才需介入,從而實現一對多管理。人機比例從1:1、1:2、1:5到1:10將快速提升,但從1:10提升至1:100甚至1:1000將極其困難。
盡管這在技術上極具價值,但從商業收益看,從1:1提升至1:10已節省90%人力成本,而從1:10到1:100僅再節省0.9%,過程中可能需付出百倍甚至千倍成本。因此,達到1:10可能已是短期內最具效率的方案。
陳亮:非常有意思。當舞臺上眾多機器人表演舞蹈時,金戈團隊的機器人最有可能率先在工廠、酒店等場景實際投入工作。接下來請教章欣——你原本深耕酒店AI服務領域,現在涉足硬件機器人業務,在酒店場景中發現了哪些核心痛點?計劃如何解決?
楊章欣:酒店場景非常適合具身智能機器人。原因有幾點:第一,酒店類似家庭場景,未來可泛化至家庭,而家庭是家務機器人未來落地的巨大市場;第二,酒店中的家務勞動多為人類不愿從事的工作。當前部分酒店機器人替代的是人類并不厭惡的任務(如跳舞),這并非核心價值所在。具身智能無需替代人類開車,因為自動駕駛已解決該問題,但酒店或家庭房間必須依賴類人機器人的實體(至少雙臂)進行整理。
這個場景甚至比工廠更適合,因當前具身機器人主要解決柔性物體處理問題,而非剛性物體——后者在工廠已通過單臂機械臂或流水線很好解決。柔性物體如衣物、毛巾、床單的整理,在此前一代機器人中難以勝任。此外,泛化能力要求雖存在,但酒店場景相對標準化,仍是這一代具身機器人能夠應對的領域。
美國、歐洲酒店因移民政策變化導致人工成本持續上升,而我司主要服務海外酒店,這是良好機遇。痛點具體表現為:人工成本因移民政策改變而升高;人員流動率高,招聘困難;服務標準化程度不足,常因清潔不徹底引發客戶投訴;機器人可相對改善這些問題。另一點,美國酒店普遍收取小費,而部分中國顧客不習慣該文化,若由機器人提供房間打掃服務則可避免此問題,進一步提升用戶體驗。
陳亮:理解下來,核心要素是:該工作必須有人完成,機器人只是替代者;其次未來有機會泛化至家庭場景。酒店中任務多樣,如打掃衛生間、鋪換床單、立面清潔等,在多任務的標準化場景中,哪些任務可被機器人優先解決?如何推進?
楊章欣:可分為三類任務:第一類是目前較難完成的,如床單被套枕套整理。因當前機器人多為2指或3指靈巧手,5指靈巧手操作性仍較差,可能需一至兩年時間解決末端執行器問題后方可勝任。
第二類是已可通過自動化較好解決的,如疊毛巾、疊衣服、撿拾垃圾等,已基本實現完全自動化。
第三類介于兩者之間,即金戈靈御智能探討的遙操作方案,需人類智能靈活性處理邊緣案例(corner case),約占1/3。目前2/3以上的任務可通過具身智能機器人完成,已能解決酒店大部分問題,部分高難度任務仍需保留人工。未來三年內,剩余部分也可能被具身智能解決。
陳亮:意味著一段時間內可能是機器人與阿姨協同作業,人機協同,部分任務由遠程阿姨配合完成。但除技術可行性外,客戶的準備程度與付費能力同樣關鍵。中國有代表性企業云跡科技(聯想創投已投資)深耕酒店配送機器人多年,去年上市時收入約兩億,但一直未能規模化。限制云跡規模化的原因是什么?當前方案是否會面臨同樣瓶頸?
楊章欣:首先,云跡是率先探索出大部分人未察覺場景的優秀公司,讓普通民眾特別是亞洲地區用戶身邊能見到可進電梯、可送物的機器人。面臨的挑戰可能有幾個方面:第一,海外業務占比偏低,而中國市場人工成本相對較低,海外高人工成本意味著能為酒店創造更高價值;第二,場景選擇問題,作為酒店老板,最關注的是一天或一個月下來最大的人工成本去向(酒店主要成本為店租與人工),其中約一半甚至2/3至3/4流向清潔環節,若能解決房間整理清潔問題,酒店愿意支付更高溢價。而送物需求僅在部分亞洲外賣發達國家較明顯,在歐美需求極低,甚至可通過不提供該服務來規避成本。
核心問題在于為酒店創造的價值能取代多少人工成本。
陳亮:史總對此反饋是否認同?
史晨星:我認同清潔是最有價值場景,遠勝于送物。但問題在于清潔極難做好,除云跡外許多企業嘗試后失敗。例如清掃衛生間、用雙臂機器人刷馬桶,最終因效果不佳而放棄。關鍵在于能否真正打穿某個場景,否則清潔做不好則無價值。
楊章欣:如果將自動化與遙操作結合,許多場景如撿垃圾、換垃圾袋、整理洗手臺、甚至刷馬桶均可實現。部分機器人公司目標過于泛化——既想做酒店,又想做工廠、服務,導致未針對特定場景進行細分優化。未來若能誕生專注特定場景的公司或合作模式,則大有可為。在解決酒店問題的同時可采集數據,且該數據未來可用于家庭場景。
史晨星:期待看到具體demo落地情況。
陳亮:追問小問題,是否需基于場景進行硬件適配或重新設計,而非簡單采用輪式雙臂或人形機器人即可勝任?
楊章欣:是的。目前市場上未見非常合適的通用產品,這是巨大機會。必須懂酒店、了解酒店需求乃至決策流程的人,才能與技術團隊結合做好此事。
陳亮:接下來請教Jase。與其他嘉賓不同,你長期深耕硅谷且為連續創業者。過去一年國內具身智能極為火熱,聽說硅谷同樣熱度很高,能否談談在硅谷感受到的具身智能氛圍?
Jase Qiang:首先說明,我本人也是中國背景。在硅谷沉浸式與客戶打交道數年,需明確硅谷不能代表整個美國,硅谷具身智能雖有熱度,但整體熱度仍不及國內,這并非資本意愿不足,而是產業鏈約束所致。造機器人雖屬智能范疇,但涉及上下游眾多環節。
例如此次與灣區某知名大學研究靈巧手的朋友同行,在CES上看到較多優秀手部企業。這些正是機器人本體公司所需的部件,但他們難以自行制造。灣區可稱為"御三家"的Optimus、Onex、Figure是真正做機器人全流程本體與模型的企業,它們面臨供應鏈約束,尤其是地緣政治影響下。Onex宣稱今年以200美元價格接受預定,該價格令人驚訝,但若宣稱全由美國或相關企業制造,則必然存在諸多妥協,本體性能將受限。
美國優秀企業雖有先進之處,如Physical Intelligence、Skilled AI等專注技能開發的企業,但感覺未如國內生態開放,存在故弄玄虛、信息封閉現象。
陳亮:數據維度問題確實是行業共識——當前發展較大瓶頸在數據方面。你們在此領域的工作進展如何?采集哪類數據?
Jase Qiang:我們提供真實場景數據,"真機"是其中一種。作為HTC Vive出身,我們做XR Tracker多年,包括現在大家機器人用的Manus手套都配有Vive Tracker。這些硬件與場景解決方案積累多年。現在成立專門團隊服務機器人,不是同時兼顧娛樂與機器人業務。
機器人數據比LLM復雜得多——LLM有優質互聯網數據可下載清洗使用,而機器人數據大廠也沒有,因此大廠與小公司回到同一起跑線。數據金字塔頂層為真機與真人,下層量大但質量遞減。當前foundation model理解能力進展快,但應用于機器人VLA模型進行真實action時存在巨大數據gap。
我們提供真實場景數據,尤其是human-centered真人數據。公司成立前已提供真機遙操作服務,多家美國與中國著名機器人公司均有參與。MOCAP(動捕)優勢明顯——為最真實數據,無gap;但弊端也突出:成本高、效率低、質量有上限(真機不能做則無法采集)、不能跨本體遷移。
例如Tesla與figure并非純視頻方案,而是在積累大量physical data基礎上進行數據增廣。Tesla早期購買大量motion capture tracking設備進行遙操作積累,現在仍在持續,因現有數據不足才需增廣,而非上來就用synthetic data合成。AIRLAND也是先以真實數據訓練,再用synthetic data增廣。
我們提供的是submillimeter級高精度、多模態的真人采集方案,可抓取話筒快速、穩定、每次都成功,且每個動作均為毫米級細節。而遙操作僅為厘米級精度,慣性方案無絕對位置,數據質量下降且不能跨本體。真人數據可跨本體復用,服務整個行業。服務好一家人形公司后,也能為其他公司帶來幫助,而非每家自定義標準導致效率低下。
陳亮:未來以人為中心的數據量級會比真機數據大多少倍?在機器人模型訓練中未來比例如何?目前有共識嗎?
Jase Qiang:目前無共識。盡管服務不少客戶,但每家企業需求差異較大,行業處于早期階段,難以確定固定比例。
陳亮:當前客戶需求更多在真機數據還是真人數據?
Jase Qiang:作為數據公司,我們提供整體數據服務而非單純銷售設備。主要提供高精度、多模態真人采集方案,也可派遣人員采集。遙操作理論上可售設備即使用,但往往需配合retargeting(重定向)工作。
陳亮:前段時間GEN-0發布27萬小時訓練數據的具身智能模型,許多人認為GEN-0吹響了具身智能scaling law號角,未來將開始堆疊更大量的人為中心數據來訓練模型,你們怎么看?
史晨星:其采用UMI方式,涉及方法論選擇問題,你們傾向于哪種?
Jase Qiang:我們也提供UMI方案。UMI更簡單、更易擴展、成本更低,我們提供基于Web Tracker的方案,比論文中UMI增加了精確位置、觸覺壓力與開合量數據。但UMI上限也較明確——缺乏身體其他部分數據,僅能處理前端小部分任務,能解決的問題較局限。
楊章欣:能否補充其他部分數據(包括移動數據)來突破上限?
Jase Qiang:目前主要提供人體姿態+靈巧手套的多模態觸覺、位置、視覺方案。若拆除手套采用UMI方案但增加本體捕捉,可能解決部分上限問題,但因當前大部分夾爪機器人上半身靈活性有限,故此類需求不多。
陳亮:這是數據上的巨大挑戰——類型多樣且無統一共識。最后確認一下,是否認同GEN-0吹響了scaling law號角?
Jase Qiang:不敢斷言由其吹響,但認為今年是可規模化(scale)的一年。
陳亮:值得期待。回到史總,你們投資眾多公司,不少已大規模銷售或上市。從實驗室到生活場景,具身技術需跨越到何種程度才可能更好進入生活場景?
史晨星:未來的具身公司可能分為兩大類。第一類是全棧軟硬件自研、全場景覆蓋,類似蘋果封閉系統,可能僅有少數幾家企業。第二類是分散到各個場景,專注將單一場景做深做透。
當前企業在工業、商業、家用等場景進行大量POC嘗試。我認為放幾臺設備不足以證明打透場景,判斷標準是:在單一場景單一工位達到幾十臺甚至上百臺量級,才能真正立住。因此,單一場景單一工位能賣出幾十上百臺,該場景才算打透。
陳亮:有被投企業做到這一點或在路上嗎?
史晨星:兩類都有。第一類如星動紀元,全覆蓋工業、商業、家用場景,可能不打算收斂。第二類我們確實在尋找,在單一家庭場景中,維他動力預訂單接近1萬臺(尚未交付),這個量在家用戶外場景基本能立住。
陳亮:工業或商業服務場景有嗎?C端上萬臺且價格控制在萬元左右很不容易。
史晨星:工業和商業場景目前確實還未看到達到百臺量級的。像千尋、第五季等企業在工業場景已有一定規模,但未到百臺,2026年很有可能達到。
陳亮:你還在投資該方向嗎?還有哪些可投空間?
史晨星:仍持續投資,主要分為三個方向:第一,上游產業鏈(電機、關節、減速器、絲杠等核心部件),下游起量后將帶來爆發式增長;第二,更多形態(四足、雙足、雙輪足、半身、人形全尺寸/中尺寸/小尺寸);第三,更多細分場景(工業、商業、酒店等能被打透的場景)。
陳亮:此次在美國深度體驗后,看到哪些與國內不同的落地場景?
史晨星:整體相似,但確實存在需提升的場景。如支付不便,老需使用信用卡,未來機器人能否解決掃碼支付問題?酒店基礎設施能否迅速升級?兩國國情不同但可互相學習。
陳亮:時間有限,最后請每位嘉賓用一句話展望2026年具身智能落地情況。
金戈:預測2026年是操作型機器人或"干活機器人"落地元年,屆時將看到很多機器人在真實場景中創造價值,我們期待有所貢獻。
楊章欣:期待明年CES時,為亮哥預訂酒店,當電梯門打開,具身機器人走出來說:"陳總,房間已整理好,請入住。"
Jase Qiang:認為2026年機器人能干活的成果將被大眾真實看到,不僅限于去年灣區企業發布的視頻,而是真正被觸摸和體驗。
史晨星:2026年不僅是簡單落地,而是批量落地——至少百臺千臺量級,營收達到千萬級至上億級別,這是具身智能行業應努力的目標。
陳亮:非常感謝各位分享。今天CES主場的圓桌到此結束,謝謝大家。(作者|郭虹妘,編輯|陶天宇)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.