<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      從模仿到自主,機器人還需跨越三重挑戰|專訪NTU助理教授王子為

      0
      分享至

      在新加坡南洋理工大學的一間實驗室里,一只機械臂正在嘗試完成一個看似簡單的任務:抓取一個蘋果。這個動作,對于三歲的孩童來說不過是本能,但對于當今最先進的機器人而言,卻是一道難以跨越的鴻溝。

      在這個人工智能的“GPT 時刻”,我們見證了 AI 以快速迭代的方式掌握了語言、圖像甚至代碼。大型語言模型已經能在許多信息處理任務中展現出高效表現。然而,從知到行之間,橫亙著一道我們尚未完全理解的鴻溝:一個能在虛擬世界通過美國執業醫師資格考試的 AI,卻無法在物理世界為我們可靠地端來一杯水。

      這不僅是一個工程問題,更接近一個哲學命題:如果一個智能體無法與物理世界交互、感知、行動并承受后果,它是否真正理解了這個世界?在中國古典哲學中,“知行合一”被視為智慧的最高境界。而在今天的人工智能研究中,如何讓機器實現從“知”到“行”的跨越,正成為這個領域最前沿、也最艱難的挑戰。

      王子為的研究經歷,正是在這一問題背景下展開的。從清華大學的物理系,到 AI 研究,再到具身智能(Embodied AI)——他的每一次轉向,都與技術發展趨勢密切相關。


      (來源:受訪者提供)

      兩次“轉向”:從物理定律到機器人鐵律

      2016 年,當 AlphaGo 與李世石的圍棋對決吸引全球目光時,王子為還是清華大學物理系數理基礎科學專業的一名學生。在當時的學術路徑規劃中,物理系的學生,未來大多走向理論物理、高能物理或是金融工程。但這場人機大戰,徹底改變了這個 20 歲年輕人的人生方向。

      “當時覺得這個東西非常神奇,有非常大的潛力。”回憶起那個轉折點,王子為的語氣依然帶著當年的激動。這種激動促使他做出了一個大膽的決定——從物理學轉向人工智能研究。“我們當年有很大一部分同學都轉向了 AI 相關的工作,不管是計算機、電子還是自動化,多多少少都受了 AlphaGo 的影響。”

      但真正讓他從 AI 轉向機器人研究的,是 2020 年另一項發表在Nature的里程碑式工作——“Robot Chemist”。來自英國利物浦大學的 Andrew I. Cooper 教授課題組開發了機器人化學家,其可以在實驗室“走來走去”并如同人類化學家一樣操作實驗儀器,完成各種各樣的實驗任務。

      這項研究讓他意識到:相比純粹的算法研究,AI 與物理世界的結合可能是一個更具空間的方向。

      同年,他開始了 AI 與機器人結合的研究,從純粹的 AI 走向具身 AI。“我記得非常的清楚,”他回憶起2020年第一次調試機器人,“看到我們自己設計的機械臂,能夠完成打包工作,把一個物體像人一樣打包進盒子里面……那一份成就感,哪怕過去這么多年了,也是記憶猶新。”

      加速的時代,CMU 的“快”與“慢”

      在 AI 這個以月為迭代周期的領域,快是公認的信條。算法在加速,模型在膨脹,論文在增長。然而,王子為在博士畢業后前往卡內基梅隆大學(CMU)進行博士后研究時,學到的最重要的一課,卻是“慢下來”。

      “讓研究慢下來,其實不容易。”王子為發現,當AI 與機器人結合,研究的范式就徹底變了。在純AI 領域,一個想法的驗證周期可能很短:設計一個新模型,在已有的數據集上跑一下,幾個小時或幾天后,就能迅速驗證想法是否有效。但在機器人領域,這個周期會被無限拉長。

      “要把問題想清楚是需要時間的。”王子為舉例,在機器人上驗證一個新算法,首先要采集數據。這個過程是物理的、實時的、昂貴的。“機器人采數據是需要時間的,是需要成本的。”采集完數據,還要進行漫長的訓練和調試。

      更重要的是,物理世界遠比數據集要狡猾。“比如,我們設計的框架對不同的網絡結構、不同的硬件,是不是都有效?增加數據之后,在特定的問題上,它是否會產生像物理學里面那種相變?”就像 GPT 模型在數據量跨越某個閾值后突然涌現出能力一樣。在機器人領域,這個涌現點在哪里?沒有人知道。

      “這都是需要時間的。”他反復強調。

      他在 CMU 參與的一個項目,是研究如何通過人類的語言或草圖,來生成樂高積木的拼接方案,并指揮機器人完成組裝。這聽起來像個玩具問題,但其背后的技術復雜度是驚人的。這套系統首先需要理解人類模糊的指令(造一個帶兩個窗戶的紅房子),然后生成一個三維的、符合物理拼接邏輯的模型;接著需要規劃機器人的每一步操作(抓取、旋轉、放置),最后才到讓機器人執行高精度的動作的環節,并還要保證全過程的安全。

      “這個工作從 2023 年就開始了,一直到今年(2025年)才有一個里程碑式的結果,但最后這篇論文也是拿到了 ICCV 的 Best Paper。”

      一個看似簡單的搭樂高任務,耗費了團隊數年的時間。這種“慢”,在如今的加速社會里似乎是不可想象的。但王子為認為,正是這種“慢”,讓他們能夠沉淀下來,去發現一些平常容易忽略的,但是真正重要的一些問題。

      與此同時,CMU 的合作氛圍為研究帶來了一種“快”。不同實驗室在硬件、感知、移動平臺等方面能力互補,使項目推進更為高效。這種“快”與“慢”的結合,也影響了他后來在 NTU 開展研究的方式。

      蘋果掉在地上:具身智能的“阿喀琉斯之踵”

      “我們實驗室的長期目標,是為機器人賦予能夠理解世界、并且能夠自主決策的大腦。”

      在 NTU 的實驗室里,王子為正試圖回答這個領域最核心的難題:為什么今天的機器人,本質上仍然是模仿者,而不是決策者?他用一個極其生動的例子,點出了具身智能的“阿喀琉斯之踵”——泛化性(Generalization)。

      “以抓蘋果為例。蘋果放在桌子上,很多模型表現都能把它抓起來。這是我們通常在演示視頻里看到的。但是,如果某一次抓的時候沒抓穩,蘋果掉在地上了,那么很多的機器人的模型現在就會直接 fail 掉。因為在訓練的過程中,它可能壓根就沒有見過這種類似的數據。”

      這就是當前主流的模仿學習(Imitation Learning)范式的弱點。模型只是在復現它在訓練數據中見過的軌跡,它并沒有真正理解這個任務。“人哪怕看到蘋果掉在地上,我理解到蘋果、桌子、地板之間的規律,以及這個世界的物理運行規律,包括摩擦力、包括重力……它都是能夠解決的。”而機器不能。這就是“分布外”(Out-of-Distribution, OOD)問題。當機器人遇到一個它訓練數據分布之外的、全新的情況時,它就束手無策了。

      背后的挑戰可以概括為三類,這也是整個行業共同面臨的“三座大山”:

      其一,數據昂貴。機器人數據必須在真實物理環境中采集,每條數據往往要數十秒甚至更久,難以像語言模型那樣依靠大規模互聯網數據訓練;其二,物理精度要求高。幾毫米的誤差都可能導致任務失敗,小偏差的累積會迅速放大;其三,環境物理規律多變。摩擦、質地、光照等因素的微調都會影響動作效果,模型需要實時建模這些隱性變量。

      走向“自主”:世界模型、推理鏈與強化學習

      為了應對上述難題,王子為團隊正在探索三類方法。

      第一條路徑,是嘗試用世界模型(World Model)打破數據詛咒。既然物理世界的數據采集那么昂貴,我們能不能讓機器人在“腦海中”采集數據?這就是世界模型的邏輯。“它根據當前的觀察和即將要采取的一個動作,就會提前預判后續會產生什么樣的后果。”王子為解釋道,“也就是說,我不需要真的去做這個事,我只需要在我腦海里面想一下,我就知道會產生什么樣一個后果。”

      通過世界模型,機器人可以在“想象”中源源不斷地產生訓練數據,極大地降低數據成本。當然,前提是這個“想象”要足夠逼真。這是王子為團隊的重點方向之一,即如何生成真正跟真實的數據差距比較小的高質量數據。

      第二條路徑,是用推理鏈解決長程任務。當前的機器人模型(如 VLA,Vision-Language-Action 模型)普遍“短視”。它們能做好抓取蘋果這樣的一步動作,但無法完成做一份早餐這樣的長程任務。“做早餐,它可能需要 20 步,甚至 30 步。打開冰箱、拿出食材、洗、切、煮、端到桌子上。”王子為說,“這是一個需要推理能力的長程任務。”而受大語言模型思維鏈(Chain-of-Thought)的啟發,王子為團隊的思路是,把長任務拆解成一步一步的短任務,讓機器人每次只去解決一小步。

      但核心問題是:怎么“拆”才是最優的?人類認為的 20 步,不一定是模型認為最高效的 20 步。他近期的工作(如 ThinkBot 和 VLA-Reasoner)就是為了解決這個拆解問題。他們嘗試用蒙特卡洛搜索樹和強化學習的方法,去搜索一個最優的拆解方案。“機器人需要推理物體與物體之間的關系(空間上),也需要推理動作與動作之間的關系(時間上)。”

      第三條路徑,用強化學習跳出模仿的范式。這是最激進,也可能最具革命性的一步。它試圖徹底解決那個“蘋果掉在地上”的 OOD 問題。模仿學習的覆蓋面總是有限的,“人是沒有辦法去窮盡所有的分布外的情況的。“那我們能不能,”王子為設想,“不再依賴于人類的數據采集,而是說通過自己主動的去嘗試一些東西?”

      這就是強化學習的回歸。讓機器人自己去探索,甚至主動犯錯。“比如說,它自己主動覺得,這個蘋果如果將來掉到地上之后,我可能不確定怎么去拿,那么他就會自己主動去嘗試,把這個蘋果弄到地上,然后去把它抓起來,在這個過程中進行學習。”這是一種根本的范式轉變:從“向人類學習”(Learning from Human)轉向“自主學習”(Self-learning)。

      這標志著機器人從一個被動執行的工具,開始向一個主動探索的智能體(Agent)進化。王子為提到,近期已有很多論文顯示,通過這種方式,機器人在某些任務上能達到接近 100% 的成功率——這是純模仿學習無法企及的高度。

      從“知”到“行”:熱情是最后一公里

      迄今,那只機械臂仍在不知疲倦地重復著訓練動作,身后的科研工作者們還在夜以繼日地調試。它還不夠完美,偶爾會失誤,會在意想不到的情況下“手足無措”。但正是這些失敗,構成了通向理解的必經之路。這也讓我們在采訪的最后,不禁問出了那個問題:在這樣一個瞬息萬變、充滿不確定性的領域,究竟什么樣的人才能走到最后?

      “我認為是要有熱情和快速學習的能力。“因為一個頂級的研究者,他肯定是這個世界上對于這個細分小領域最了解的人,至少是之一。所以他每往前邁一小步,其實都是要面臨無限的不確定性和挑戰。這種情況下,研究在很多時候就是一份煎熬。只有真正對這個領域充滿熱情的人,期待能夠看到自己把這個東西做出來、并且覺得有成就感的人,才能夠克服這份煎熬。”

      在快速演化的具身智能領域,研究者需要面對復雜系統帶來的不確定性。算法在一個場景中表現良好,換一個位置或環境后可能完全失效;不同批次的數據可能帶來截然不同的訓練結果;許多問題缺乏現成答案,需要從頭推導和驗證。

      為了保持學習效率,王子為在實驗室推動“論文快講會”,讓團隊成員每周快速總結新的研究進展,并相互討論。他認為,在一個知識迭代迅速的領域,團隊式學習能更好地保持對前沿的敏感。

      在應用層面,他的團隊也在與制造行業合作,包括汽車、飛機維保、物流等場景,希望在真實工業環境中采集到更高質量的數據,為未來的機器人模型打下基礎。

      具身智能仍是一個不斷發展的領域,從“知道”到“做到”之間仍有距離。研究者在其中要面對工程復雜度、物理系統的不確定性,以及長期投入的要求。通往可用的通用機器人系統,仍需要時間、耐心和持續不斷的跨學科合作。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      奧迪AUDI E7 X官圖發布 將于2026北京車展亮相

      奧迪AUDI E7 X官圖發布 將于2026北京車展亮相

      太平洋汽車
      2025-12-08 16:18:08
      芋頭立大功?醫學研究:芋頭可在12小時內清除40%腸道垃圾?

      芋頭立大功?醫學研究:芋頭可在12小時內清除40%腸道垃圾?

      涵豆說娛
      2025-11-01 15:34:09
      可控核聚變,最正宗的4家公司

      可控核聚變,最正宗的4家公司

      Thurman在昆明
      2025-12-08 12:41:46
      中國第一省會,到底“養活”了多少人?

      中國第一省會,到底“養活”了多少人?

      孫不熟讀城市
      2025-12-07 23:33:17
      妻子韓雯雯回應“朱孝天被退出F4”:他為合體月瘦30斤,我看到很揪心;網上謾罵挺傷人,現在也不想爭什么

      妻子韓雯雯回應“朱孝天被退出F4”:他為合體月瘦30斤,我看到很揪心;網上謾罵挺傷人,現在也不想爭什么

      大象新聞
      2025-12-08 00:18:07
      迷失無人區:女子帶藏獒無人區失聯兩周,警方找到車,車內只剩藏獒

      迷失無人區:女子帶藏獒無人區失聯兩周,警方找到車,車內只剩藏獒

      罪案洞察者
      2025-11-10 13:57:07
      就在今天!12月8日,WTT香港總決賽賽程出爐,CCTV5直播 附賽程表

      就在今天!12月8日,WTT香港總決賽賽程出爐,CCTV5直播 附賽程表

      皮皮觀天下
      2025-12-08 04:59:13
      國家這次動真格了!國務院親自下場對煙草市場來一次徹底的大掃除

      國家這次動真格了!國務院親自下場對煙草市場來一次徹底的大掃除

      達文西看世界
      2025-12-07 21:29:39
      11000元/瓶茅臺,秒光!

      11000元/瓶茅臺,秒光!

      中國基金報
      2025-12-08 12:58:34
      苦相臉、觀眾緣差的藍盈瑩,這次亮相尖叫之夜,竟被網友紛紛怒贊

      苦相臉、觀眾緣差的藍盈瑩,這次亮相尖叫之夜,竟被網友紛紛怒贊

      流云隨風去遠方
      2025-12-07 18:33:34
      東方衛視首播!35集諜戰巨制來襲,開播一天,口碑爆表。不輸潛伏

      東方衛視首播!35集諜戰巨制來襲,開播一天,口碑爆表。不輸潛伏

      樂楓電影
      2025-12-08 15:41:04
      寧夏原首富旗下公司執行重整計劃:6409戶申報1787億元債權

      寧夏原首富旗下公司執行重整計劃:6409戶申報1787億元債權

      黃桷樹財經
      2025-12-08 10:26:06
      兩岸喜訊!大陸萬萬沒想到,沒等我軍正式收臺,臺當局送“大禮”

      兩岸喜訊!大陸萬萬沒想到,沒等我軍正式收臺,臺當局送“大禮”

      瞳哥視界
      2025-12-03 21:44:15
      3.5萬噸級重載群組列車開行試驗成功

      3.5萬噸級重載群組列車開行試驗成功

      每日經濟新聞
      2025-12-08 10:54:25
      詹姆斯·沃森去世,因發現“DNA雙螺旋結構”享譽世界,晚年宣稱“黑人因基因智力低”而飽受爭議

      詹姆斯·沃森去世,因發現“DNA雙螺旋結構”享譽世界,晚年宣稱“黑人因基因智力低”而飽受爭議

      生物世界
      2025-11-08 08:11:39
      恭喜!今天起3大生肖財運開掛,橫財狂賺,喜提10年一遇大運

      恭喜!今天起3大生肖財運開掛,橫財狂賺,喜提10年一遇大運

      人閒情事
      2025-12-08 16:10:01
      新華社爆錘小米:膽量為何這么大?

      新華社爆錘小米:膽量為何這么大?

      微評社
      2025-12-06 20:48:27
      女同學餓肚我給塞饅頭,多年后她任市委書記,提拔名單上紅眼愣神

      女同學餓肚我給塞饅頭,多年后她任市委書記,提拔名單上紅眼愣神

      曉艾故事匯
      2025-12-07 08:00:14
      《阿凡達3》首映禮:章子怡撞型向太,鄧超偷親孫儷,都老了

      《阿凡達3》首映禮:章子怡撞型向太,鄧超偷親孫儷,都老了

      深析古今
      2025-12-08 16:00:37
      國內賺錢國外花,產品全抄別人家,富家女程曉玥終于翻車了

      國內賺錢國外花,產品全抄別人家,富家女程曉玥終于翻車了

      娛小北
      2025-12-07 19:52:53
      2025-12-08 17:32:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15961文章數 514351關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

      頭條要聞

      40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      重磅!政治局會議定調明年經濟工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      本地
      房產
      健康
      教育
      親子

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      房產要聞

      碧桂園,開始甩賣海口家底!

      甲狀腺結節到這個程度,該穿刺了!

      教育要聞

      父母永遠不要與孩子分享的8件事,關系再好也別說

      親子要聞

      奧運冠軍助陣!廣東“公益體彩 快樂操場”助力萌娃體育夢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 97久久久亚洲综合久久| 国产成人高清亚洲综合| 欧美阿V| 中文字幕美人妻亅u乚一596| 久久天天久久| 色小说综合网| 国产精品第八页| 亚洲中文字幕AV| 内丘县| 亚洲色综合| 苗栗市| 伊人久久精品| 亚洲第一无码AV无码专区| 国产亚洲精品久久久久久牛牛| 特级做a爰片毛片免费看无码 | 97久久草草超级碰碰碰| 无码成人精品区在线观看| jiZZjiZZ欧美69| 国产女同一区二区在线| 内射自拍| 旅游| 双鸭山市| 丰满熟妇人妻av无码区| 丁香婷婷综合激情五月色| 久久se精品一区精品二区国产 | 在线免费观看毛片av| jlzz大jlzz大全免费| 无码人妻久久久一区二区三区| 国产喷水1区2区3区咪咪爱AV| 欧美亚洲一区二区三区在线| 欧美日本在线一区二区三区| 国产在线永久视频| 性欧美videofree高清精品| 综合成人亚洲| 肥西县| 国产av中文字幕| 久久婷婷五月综合| 中文字幕av在线| 精品国模无码| 一区777| 岳乳丰满一区二区三区|