2025年12月26日,【想象·2025極新AIGC峰會】在上海浦東浦軟大廈成功召開。青瞳視覺副總裁季耀輝先生在會上做了題為《具身數據標注通往未來的迭代之路》的演講。重點分享了青瞳視覺的發展情況、發展歷程以及他們在具身智能領域的一些成就和突破。
![]()
青瞳視覺副總裁 季耀輝
季耀輝重點提到以下幾點:
“具身智能的核心是實現 “數據 - 算法 - 場景” 的閉環。“
“目前,具身智能行業的數據采集與標注已具備一定基礎,部分企業已通過現有數據訓練模型并取得初步效果,但仍存在諸多未解決的問題。”
“我們的技術創新以自研為核心,同時秉持開放合作的心態,積極聯合行業伙伴,共同開發新產品、完善解決方案。”
以下內容為嘉賓分享實錄,經極新整理,希望能給大家帶來收獲。
本次分享聚焦具身智能,目前我們已與智元、宇樹機器人等頭部機器人企業、無人機公司、AI 大模型公司及重點生產企業建立了廣泛合作。
01
具身智能落地的重要挑戰
“具身智能的核心是實現 “數據 - 算法 - 場景” 的閉環”
青瞳視覺在具身智能領域的核心任務,是數據采集與數據標注服務。這一業務對具身智能的發展至關重要,2024 年至 2025 年,具身智能數據采集與標注行業發展迅猛,投融資活動十分活躍。作為技術驅動型企業,我們更關注技術發展帶來的新要求與潛在市場機遇。
從國外馬斯克旗下的相關企業,到國內優秀的機器人企業,人形機器人及各類專業機器人的發展速度令人矚目。它們的能力不斷升級,從春晚舞臺上的舞蹈表演,到如今完成復雜任務,未來還將涉足老人看護、醫療輔助、生產線自動操作等多個領域。要實現這些復雜功能,核心前提是獲得高質量、高精度的訓練數據 —— 機器人需要通過這些數據快速學習技能,并在實際操作中通過反饋持續優化,這正是具身智能發展的關鍵所在。
用通俗的邏輯解釋,具身智能的核心是實現 “數據 - 算法 - 場景” 的閉環:機器人需要 “看見”“聽見”“觸摸” 這個世界,獲得實時反饋,從復雜數據中提取有效信息,指導后續決策與行動;行動后產生的新數據又將作為下一輪學習的基礎,形成持續迭代的循環。
當前,部分具身智能領域已展現出令人驚嘆的成果,自動駕駛就是典型代表。自動駕駛汽車通過激光傳感器或純視覺傳感器,能夠精準識別道路標線、指示牌、行人、非機動車及各類突發情況,并迅速作出反應。這一能力的背后,是數億甚至數十億公里的海量數據采集,以及對這些數據的詳細標注與持續迭代訓練 —— 這也正是具身智能領域的核心發展邏輯:在不斷迭代、學習與成長中,逐步掌握復雜任務。
對比不同階段的 AI 模型,數據需求的復雜度呈階梯式上升:純文本的大語言模型(如早期 ChatGPT),僅需文本數據進行訓練,互動與評價也以對話為主;進入多模態時代,視覺大模型需要處理數以億計、甚至數百億計的圖片與視頻動態視覺信息;駕駛大模型的需求更為復雜,不僅需要視覺數據,還需結合任務目標、操作行為及結果反饋,進行綜合判斷;而具身大模型的復雜度又上了一個維度。
以簡單的 “拿起一瓶水” 為例,機器人需要判斷瓶子的軟硬程度,控制合適的力度 —— 既不能過大導致捏壞瓶子,也不能過小導致瓶子滑落。在復雜場景中,如操作精密機器時,機器人需要精準控制機械臂的角度、端點位置與力度;在化工反應場景中,還需結合溫度、壓強等多維度參數。這些需求使得具身智能的數據采集在密度、維度上呈指數級增長,數據標注的難度也隨之大幅提升。此外,還需解決數據時間軸對齊、節拍一致等問題,更要應對執行過程中的偏差修正 —— 如何在偏離預設方向時及時調整,是具身智能落地的重要挑戰。
目前,具身智能行業的數據采集與標注已具備一定基礎,部分企業已通過現有數據訓練模型并取得初步效果,但仍存在諸多未解決的問題。當前技術更多能應對移動相關的基礎需求,通過平面坐標系、標定、避障等簡單邏輯實現功能,但在高維度、高精度操作(如力度控制)、現實與數字信號的雙向轉換等方面,仍有巨大提升空間。例如,從現實世界采集數據并轉化為數字信號,再將訓練成果還原到現實場景,這一過程存在采樣局限與信息提煉的雙重挑戰,如何確保還原過程的準確性與穩定性,是行業面臨的核心難題。
當前主流的四種數據采集方式均存在明顯弊端:純真人采集效率極低;虛擬數據易與現實脫節;純視覺數據缺乏多維度參考,只能實現部分采樣;而現實信息的抽象提取與還原過程,經過兩層轉換后易出現模擬失真。
針對這些痛點,青瞳視覺提出了優化方案 —— 雖無法一勞永逸解決所有問題,但實現了顯著突破:
第一,實現多模態采集。通過統一操作流程,同步采集視頻、音頻、觸感、反饋等數據,未來還將拓展溫度等更多指標,確保數據的完整性與持續性。
第二,提升采集精度與穩定性。依托傳統光學技術優勢,實現比慣性采集等常規手段更高的定位精度;同時通過多模態數據互補,解決光學攝像頭遮擋問題 —— 遮擋時由慣性系統提供數據支持,光學系統恢復工作后再對慣性數據進行校準,實現快速、完整、準確的數據采集。
第三,實現數據復用與場景適配。一次采集的數據可適配多種終端、不同類型的機械手與機械臂;采集方案具備強環境適應性,可應用于露天場景、實際生產車間等復雜環境;通過自主設計的流程方案實現數據倍增,突破純真人采集的局限。
02
解決方案還需多元
“我們的技術創新以自研為核心,同時秉持開放合作的心態,積極聯合行業伙伴,共同開發新產品、完善解決方案。”
具體來看,我們的方案整合了光學傳感器、慣性傳感器、力反饋傳感器(可采集法線方向與切線方向的摩擦力數據)及溫度等其他傳感器,通過光學系統對采集環境進行校準,進一步提升數據準確率與質量。這套方案能夠實現高準確度、高適應性的多模態數據采集,結合與各行業客戶合作開展的數據標注與數據倍增工作,可滿足大批量、快速采集的需求,服務于機器人、汽車生產企業、智慧工廠、智慧物流等多個行業。
除了核心的觸覺手套 + 光學捕捉方案,我們還針對不同行業需求,打造了多元化的解決方案:
精準定位與性能評測:光學定位方案的重復定位精度可達 0.01 毫米,已成為機器人行業行為準確度的核心評測標準,我們在蘇州設立的評測中心,可承接各類人形機器人及專業機器人的性能評測業務;
靈巧手精準操作:通過在手上貼光學觸點的方式,實現無需手套的高精度細致操作;
多場景數據采集:涵蓋遙操作、工廠實地訓練數據采集,無人機、機器狗在強紅外光、日光照射等特殊環境下的采集,仿生機器人、機械臂操作采集,以及水下采集(已解決能見度、折射等水下環境帶來的影響);
柔性對象采集:針對易形變、易誤識別的柔性采集對象,通過技術創新實現精準檢測與采集。
我們的技術創新以自研為核心,同時秉持開放合作的心態,積極聯合行業伙伴 —— 例如與觸覺傳感器技術領先但光學領域薄弱的企業合作,共同開發新產品、完善解決方案。在此,我們誠摯歡迎行業內各類企業與我們對接:無論是有業務需求,還是擁有可補充我們技術短板的優質方案,都期待與大家攜手,共同開拓這一對國計民生與市場發展具有重要意義的新興領域。
更多干貨分享敬請注我們的公眾號與視頻號~超多精彩對話內容等待您的解鎖!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.