<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI 為什么不會規劃?Yann LeCun團隊:問題出在「時間是彎的」

      0
      分享至


      來源:機器之心

      在人工智能的發展歷程中,有一位科學家幾乎貫穿了整個深度學習時代 —— 他就是 Yann LeCun。

      許多人第一次接觸神經網絡,往往就是通過他在上世紀提出的手寫數字識別系統LeNet。這一早期的卷積神經網絡模型不僅成功應用于銀行支票識別,也為后來席卷全球的深度學習浪潮奠定了重要基礎。

      與如今大量研究者將目光投向生成式 AI 不同,LeCun 近年來一直在強調另一條更長期的研究路線:構建能夠理解世界并進行規劃的 「世界模型」(World Model)。

      在他看來,當前模型雖然在文本與圖像生成上表現驚艷,但仍然缺乏一種關鍵能力 ——現實世界進行建模,并預測未來可能發生的變化。

      圍繞這一愿景,來自 Meta 與 New York University 等機構的研究者(其中也包括 LeCun 團隊的成員)最近發布了一篇新論文,嘗試解決世界模型中的一個基礎問題:如果我們希望 AI 在潛在空間中進行規劃,那么這種表示空間應該具備怎樣的結構?


      • 論文標題:Temporal Straightening for Latent Planning

      • 論文鏈接:https://arxiv.org/pdf/2603.12231

      視覺特征的「曲率陷阱」

      這項研究的核心靈感源自神經科學中的一個著名假設 ——感知直道化(Perceptual Straightening)。人類視覺系統在處理自然視頻流時,傾向于將復雜的視覺輸入轉化為在大腦皮層中軌跡更平直的表征,從而預測物體的運動。

      研究指出,雖然預訓練編碼器能夠學習到豐富的語義表示,但其在潛在空間中形成的時間軌跡通常具有較高的曲率,這使得基于該表示進行規劃變得更加困難。

      這種高曲率帶來了兩個致命問題:

      • 距離失效:在復雜的潛空間中,簡單的歐幾里得距離無法準確反映到達目標狀態的真實難度(測地距離)。

      • 規劃不穩定:基于梯度的規劃算法在彎曲的景觀中極易陷入局部最優,導致智能體在任務中「原地打轉」或邏輯斷層。


      預訓練視覺編碼器所編碼的潛在軌跡通常高度彎曲(DINO),這增加了預測和規劃的難度。本文引入了一個幾何約束,在此空間中可行的軌跡更加平直(Ours)。

      時間直道化

      為了解決這一問題,研究團隊引入了一個幾何約束 ——曲率正則化器(Curvature Regularizer)

      傳統的潛空間規劃通常學習一個編碼器 和一個預測器 。但在復雜的動態環境中,相鄰狀態在潛空間中的軌跡往往是劇烈彎曲的。

      為了實現「拉直」,研究團隊提出了基于曲率(Curvature 的約束。在潛空間中,定義連續三個時間步的表征為 。

      1. 曲率的數學定義

      直道化的核心是要求潛空間中的運動軌跡盡可能接近勻速直線運動。公式上,這體現為相鄰兩個時間步的「位移向量」應該盡可能一致:

      如果軌跡是完全筆直且勻速的,那么這兩個向量應該相等。

      2. 曲率損失函數

      論文引入了以下損失函數來懲罰軌跡的彎曲程度:

      或者使用單位向量的夾角余弦值來衡量方向的一致性:

      這個正則項會強制編碼器 將原始視覺輸入映射到一個平滑的空間中,使得狀態轉移在該空間內表現為線性演化。


      訓練與規劃示意圖。在訓練過程中,一方面最小化預測嵌入 與目標分支中帶有停止梯度的目標 之間的預測損失,另一方面最小化嵌入的局部曲率。在規劃過程中,我們使用訓練好的預測器進行時域 的展開推演,并在嵌入空間中選擇能夠最小化預測最終狀態與目標之間成本的最優動作。

      通過這種方式,模型共同學習了一個更「平滑」的編碼器和一個更「直覺」的預測器。這種「拉直」操作產生了兩個神奇的效應:

      • 歐幾里得距離 = 測地距離:在拉直后的空間里,兩個點之間的直線距離就能精準代表從 A 態轉移到 B 態的成本。

      • 改善目標條件調節:規劃目標對路徑的引導變得更加線性且穩定。


      直道化前后的潛空間軌跡對比。 上方的 PushT 示例展示了一個旋轉動作,下方的 UMaze 示例展示了智能體從左上角移動到右上角的過程,其中星號表示目標。直道化產生了更少彎曲且更平滑的軌跡,并使歐幾里得距離能夠更真實地反映通往目標的測地線進展(即實際步數)。

      實驗結果:攻克「傳送門」迷宮

      為了驗證這一理論,研究團隊設計了一個極具挑戰性的實驗環境:Teleport-PointMaze(帶傳送門的點迷宮)。

      在這個迷宮中,當智能體觸碰右側墻壁時會瞬間「傳送」到左側,這種瞬時的位置跳躍對傳統的預訓練編碼器(如 DINOv2)是巨大的災難。


      不同編碼器的潛在曲率與開環 GD 成功率對比。余弦相似度越高表示曲率越低。此處比較了具有空間特征的模型,并報告了平均逐塊余弦相似度。在編碼器類型相同的情況下,曲率的降低通常會導致成功率的提升。

      研究通過計算潛空間中任意點與目標點(Target)之間的 均方誤差(MSE),生成了距離熱力圖。


      PointMaze 的距離熱力圖(藍色表示小值,紅色表示大值)。黃色五角星代表目標位置,計算其嵌入與迷宮中所有其他狀態嵌入之間的歐氏距離。圖 b 和圖 c 使用了經過平直化正則化訓練的 ResNet,其輸出特征 。經過平直化處理后,潛在距離能夠準確反映到達目標所需的最小步數。


      • DINOv2 (a):其熱力圖呈現出支離破碎的斑塊,完全無法反映迷宮的物理拓撲結構,規劃算法在此空間內幾乎是「盲目搜索」。

      • 無直道化的投影器 (c):雖然經過了任務微調,但熱力圖依然顯示出嚴重的扭曲,無法正確識別傳送門的連接性。

      • 時間直道化(b):神奇的事情發生了 —— 熱力圖顯示出的梯度非常平滑,且完美契合了地標真值(d)。這意味著在直道化后的空間里,簡單的歐氏距離就能精準指導智能體穿過傳送門。

      世界模型研究的新線索

      隨著世界模型研究不斷發展,越來越多學者開始關注:什么樣的表示才真正適合規劃?

      這篇論文給出了一個簡單但有啟發性的答案:在一個好的 latent space 中,時間軌跡應該盡可能是直線。

      這種設計不僅可以提高規劃效率,還可能影響未來許多研究方向,例如機器人控制、視頻世界模型、自動駕駛……

      或許正如 Yann LeCun 所強調的那樣:真正的智能,離不開一個能夠理解并預測世界的模型。

      而讓「時間變直」,可能正是通往這一目標的重要一步。

      閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


      未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

      (加入未來知識庫,全部資料免費閱讀和下載)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      他從正軍職轉任副廳職,2年后找老帥、總長、總政主任申訴回部隊

      他從正軍職轉任副廳職,2年后找老帥、總長、總政主任申訴回部隊

      驚視
      2026-04-04 14:07:43
      上海VS吉林沖擊十六連勝!懷特塞德繼續統治內線,盧偉展望季后賽

      上海VS吉林沖擊十六連勝!懷特塞德繼續統治內線,盧偉展望季后賽

      老葉評球
      2026-04-04 16:48:31
      廣州早茶新規,5月1日起實施→

      廣州早茶新規,5月1日起實施→

      FM96.2廣州新聞電臺
      2026-04-04 10:16:58
      國安三輪不勝!媒體人熱議:輸球非個例,戰術粗線條陣容太單薄

      國安三輪不勝!媒體人熱議:輸球非個例,戰術粗線條陣容太單薄

      奧拜爾
      2026-04-04 17:55:30
      臺積電:我們已經顧不上美國工廠了,大陸再不給稀土,大家都得完

      臺積電:我們已經顧不上美國工廠了,大陸再不給稀土,大家都得完

      觸摸史跡
      2026-04-03 21:47:03
      戰功赫赫的紅軍軍團長,整編時竟無人愿收,主席震怒直言純屬瞎胡鬧

      戰功赫赫的紅軍軍團長,整編時竟無人愿收,主席震怒直言純屬瞎胡鬧

      磊子講史
      2026-03-30 15:41:41
      萬科裁員1.25萬人

      萬科裁員1.25萬人

      地產微資訊
      2026-04-03 14:24:44
      北汽集團3月銷量超18.2萬輛,同比增長7%

      北汽集團3月銷量超18.2萬輛,同比增長7%

      IT之家
      2026-04-04 13:14:17
      《紐約時報》:特朗普根本不知道如何收拾自己造成的爛攤子

      《紐約時報》:特朗普根本不知道如何收拾自己造成的爛攤子

      奇思妙想生活家
      2026-04-04 15:14:07
      學醫后才知道,心衰最危險信號,不是氣喘,而是頻繁出現 4 種異常

      學醫后才知道,心衰最危險信號,不是氣喘,而是頻繁出現 4 種異常

      今日養生之道
      2026-04-04 13:45:35
      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      俘虜表示要露一手,朱德:我給你官當,俘虜:老哥,你比我還能吹

      俘虜表示要露一手,朱德:我給你官當,俘虜:老哥,你比我還能吹

      棠棣分享
      2026-04-01 19:10:34
      日本加息,比戰火、油價更狠!

      日本加息,比戰火、油價更狠!

      犀利強哥
      2026-04-03 22:04:33
      覆水難收,“兩人的關系回不去了”

      覆水難收,“兩人的關系回不去了”

      觀察者網
      2026-04-04 17:14:08
      入世25年,中國的財神是“WTO!而不是趙公明

      入世25年,中國的財神是“WTO!而不是趙公明

      律法刑道
      2026-04-04 08:17:06
      張雪峰創造了蘇州歷史

      張雪峰創造了蘇州歷史

      言立方
      2026-04-02 07:38:47
      為楊瀚森入股!二老板操盤,開拓者有望成為“雙中國球員”戰隊?

      為楊瀚森入股!二老板操盤,開拓者有望成為“雙中國球員”戰隊?

      民宿體驗志
      2026-04-03 15:44:55
      他是男籃名宿,拿過籃板王,如今兒子也進CBA,成為頂級中鋒

      他是男籃名宿,拿過籃板王,如今兒子也進CBA,成為頂級中鋒

      大西體育
      2026-04-04 15:41:40
      日本足球什么水平?8個世界杯冠軍贏了7個,董路黃健翔各執一詞

      日本足球什么水平?8個世界杯冠軍贏了7個,董路黃健翔各執一詞

      夏侯看英超
      2026-04-03 21:28:31
      輕斷食再次封神!復旦大學研究證實:讓肝臟脂肪在3月內少20.5%?

      輕斷食再次封神!復旦大學研究證實:讓肝臟脂肪在3月內少20.5%?

      健康科普365
      2026-04-02 10:16:49
      2026-04-04 18:19:00
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4633文章數 37447關注度
      往期回顧 全部

      科技要聞

      內存一年漲四倍!國產手機廠商集體漲價

      頭條要聞

      媒體:失蹤飛行員已成最大危機 特朗普恐無法體面退場

      頭條要聞

      媒體:失蹤飛行員已成最大危機 特朗普恐無法體面退場

      體育要聞

      剎不住的泰格·伍茲,口袋里的兩粒藥丸

      娛樂要聞

      闞清子口碑贏了!全開麥跑調拒絕重唱

      財經要聞

      中微董事長,給半導體潑點冷水

      汽車要聞

      17萬級海豹07EV 不僅續航長還有9分鐘滿電的快樂

      態度原創

      健康
      旅游
      家居
      藝術
      公開課

      干細胞抗衰4大誤區,90%的人都中招

      旅游要聞

      清明假期!山西6家景區暫時閉園

      家居要聞

      溫馨多元 愛的具象化

      藝術要聞

      西漢巨幅真跡出土!這才是草書的源頭法帖,王羲之也要叫“祖師爺”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版