![]()
盡管機器人技術發展多年,但距離真正意義上的 “智能”仍有明顯差距。泛化能力弱、應用場景受限、商業化進程緩慢等問題,始終制約著整個行業的突破。即便在最新一代機器人身上,“摔跤”“反應遲緩”“判斷失誤”等基礎性挑戰依然常見。
深入分析發現,機器人的發展瓶頸已從硬件轉向軟件,最大的挑戰仍然在于 AI 模型的突破。如果將機器人比作人類,硬件相當于發育完全的四肢,而 AI 才是真正的“大腦”,數據則是學習資料,騰訊云存儲所構建的 Data Platform 數據平臺,則相當于支撐其全面成長的“大學教育體系”。
帕西尼感知科技,作為國內領先的高精度觸覺感知與具身智能核心技術企業,其 CTO 張恒第在日前的采訪中指出:收集包含視覺、關節角度、動作軌跡、語音,以及極為稀缺的觸覺模態在內的人類與物理世界交互的全模態數據,是一個非常龐大且復雜的工程,多方對比后,帕西尼把自己所收集的這些訓練機器人所必需的全模態數據,送進“騰訊云大學”。
文 | 涵元
編輯| 浩然
本文為商隱社原創文章,轉載請聯系后臺
![]()
機器人為何看著“笨”?
在今年4月的機器人馬拉松大賽上,一臺人形機器人緩慢前進,后面跟著幾十位工程師,他們忙著調算法、換電池、抗干擾。即便如此,大多數機器人還是頻繁摔跤,窘態百出。
這一現象背后,是早在20世紀80年代就由漢斯·莫拉維克等人提出的“莫拉維克悖論”:對人類而言困難的任務(如復雜運算),對機器反而容易;而人類輕松完成的動作(如感知與運動),對機器卻異常艱難。
原因在于,前者對于機器來說,是做減法。大語言模型(LLM)等技術將人類上百萬年積累的知識壓縮到機器里,當你與 AI 聊天時,相當于你在與人類文明史對話。當你與AI比賽時,相當于你與更高維度的智力對抗。
而后者對于機器人來說,是做加法。以“拿杯子”這樣的簡單指令舉例,機器人操作起來,要經歷6個步驟、13個技術領域。
![]()
機器人對“拿杯子”動作的拆分
帕西尼 CTO 張恒第指出,人類執行的每一個動作,均涵蓋觸覺、視覺、關節角度、動作軌跡、語音等多維度信息。人類本可輕松完成的任務,對機器人來說卻極為復雜。
張恒第進一步強調:“機器人與物理世界的每一次交互都產生海量數據。在帕西尼超級數采工廠,單日數據量可達150TB,年數據規模達百 PB 級別,傳統本地存儲完全無法承載。”騰訊云存儲 Data Platform 所支撐的采集數據上傳、存儲、訓練環節,便成為海量全模態具身數據高效推進產業躍遷的關鍵。
![]()
機器人也需要“上大學”
為解決機器人學習難題,行業領先企業開始將機器人送入“大學”進行系統訓練。與人類不同,機器人的學習通過“訓練數據-植入數據”模式完成,騰訊云存儲 Data Platform 數據平臺正是這所“大學”的核心基礎設施。
我們先來看一下為何過去機器人學習不好:
● 一場數據饑荒。加州大學伯克利分校的機器人專家肯·戈德伯(Ken Goldberg)曾指出,人形機器人在技能獲取上,與 AI 聊天機器人存在著天壤之別。其核心癥結在于一場嚴重的“數據饑荒”,二者的差距為十萬年。
● 泛化能力不足。機器人僅憑視覺信號難以獲得現實世界的物理常識,這導致它們無法處理未知場景,無法進行常識推理,更無法在失敗后進行基于理解的反思與調整。
●一個模型學習了與任務無關的特征(如視角、背景)跟動作之間的虛假相關性,而非理解語言指令與目標之間的真正關系。
比如,你向小孩介紹一只貓,下次遇到其他品種的貓,他也會反應出來這是“貓”。但如果你喂養一個機器人,前期需要向他輸入大量貓的照片、類型、特征,訓練成百上千次后,機器人才會明白,什么樣的物種,可以稱為貓。
這期間,如果有一只貓長了斑點,機器人就有可能將“斑點”與“貓”聯系起來,遇到帶斑點的衣服時,機器人也可能認為這是一只貓。
在這個過程中,數據量級、質量、處理方式,都會對機器人的反應造成重要影響。
基于全球頂級的觸覺感知技術,帕西尼自研“人因”具身智能數據采集體系,采用“多維觸覺數據采集手套 PMEC ”+“空間視覺矩陣”的方式,高效、高質地采集機器人所需的與物理世界交互的全維度數據,用以幫助整個行業加速實現智能泛化進程。帕西尼選擇了騰訊云存儲 Data Platform 數據平臺,張恒第介紹,他們看重騰訊云的點為:
一是海量彈性存儲。騰訊云存儲提供了海量、安全穩定、低成本的存儲支持,滿足具身智能行業對海量統一存儲的要求。自動冷熱數據分層,熱數據極速響應,冷數據沉降至低成本 COS 對象存儲。
二是模型訓練加速。TB/s 級吞吐與亞毫秒級訪問延遲的數據處理流水線,消除 GPU 等計算資源的數據供給瓶頸,確保算力資源高飽和運轉,提升大規模模型訓練與推理效率。
三是智能化數據治理。提供全局元數據索引與語義檢索能力,實現語音、視覺、傳感流等異構數據的自動關聯分析與血緣追溯,提升文件檢索效率,為仿真決策提供高一致性訓練樣本,激活多模態數據協同價值。
“騰訊云的優勢在于:可以將數據快速加載到分發系統里并調取數據。工具鏈完整,調取模型不必借助其他工具。即時反饋,看到模型需要修改處,幫助我們快速迭代。提供良好仿真環境,讓我們在部署前就能在云上進行大量仿真驗證。安全能力高,有效防止外部攻擊。Data Platform 算力調度能力強,可以投放大量仿真任務。我們可以只用幾行簡單的命令,就能便捷地使用各種服務,非常方便。”張恒第說。
![]()
在騰訊云“大學”,數據被加工提練為可用“教材”,最后統一輸出給機器人,讓機器人突破本體限制,實現云上進化,正如人突破了肉身限制,實現認知升級。
![]()
從“硬件驅動”到“智能驅動”:
機器人步入“智斗”時代
在機器人進化史上,“硬件先行”曾是行業共識,但如今形勢已變。培養具備認知與決策能力的“機器人大腦”,不再只是技術趨勢,更是產業發展的必然選擇。
從歷史維度看,缺乏軟件支撐的機器人注定被淘汰。以日本本田公司開發的阿西莫(ASIMO)為例,這款曾集奔跑、踢球、倒咖啡等技能于一身的機器人,在誕生22年后黯然退場。其根本原因在于,阿西莫每個動作依賴三萬行控制代碼手動編寫,無法適應AI驅動的新時代。相比之下,現代機器人通過 AI 訓練,僅用幾小時就能掌握后空翻、打太極等高難度動作,效率與靈活性形成鮮明對比。
帕西尼 CEO 許晉誠指出,中國在機器人硬件制造上已位居全球第一梯隊,但“成年人的身體不能配小孩的腦子”。僅靠硬件性能的堆砌,無法滿足現代產業對柔性生產、個性化服務和快速適應的需求。
在這一背景下,“智斗”能力成為機器人的核心競爭力。
帕西尼 CTO 張恒第強調:“短期目標是持續迭代帕西尼包括傳感器、靈巧手、人形機器人、數據采集系統等觸覺產品矩陣的能力;長期目標是通過帶有重要觸覺模態的全鏈條具身智能核心技術,推動 AI 與物理世界的深度融合,加速具身智能在物理世界中的認知與操作能力進化。”在這一進程中,騰訊云提供的存儲與算力支持成為關鍵基礎設施。通過其高可用、高并發的數據處理能力,有望降低具身智能研發的門檻,加速“智能涌現”時刻的到來。
當前,機器人廠商正積極構建“數據飛輪”閉環——通過實際場景中的數據反饋持續優化模型,進而提升機器人的智能水平。帕西尼的 TORA-ONE 機器人已應用于醫療、物流、工業制造乃至地鐵安檢等多元場景,不同領域的數據特性與任務需求,進一步凸顯了云端訓練與迭代的重要性。
![]()
如今,在騰訊云存儲構建的“大學”環境中,機器人正實現從單體智能到群體智能的跨越。當機器人從這所“大學”畢業之時,就是其真正融入人類生活、開啟智能新紀元的開端。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.