<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      輕量級模型媲美72B模型,英偉達、MIT等聯合推出FoundationMotion

      0
      分享至



      當前的視頻大模型發展迅速,但在面對復雜的空間移動和物理規律時,依然 “看不懂” 物體如何運動。

      它們或許能描述視頻中發生了什么,但如果你問它:“紅色的車是在藍色車轉彎之前還是之后通過路口的?” 或者 “那個皮球的拋物線軌跡最高點在哪里?”,很多模型就開始 “胡言亂語” 了。

      究其根本,在于高質量運動數據的極度匱乏。現有的數據集要么規模太小,要么依賴昂貴的人工標注,難以支撐模型去學習真實世界中細粒度的物理運動。

      針對這一痛點,來自MIT、NVIDIA、UC Berkeley等機構的研究者提出了FoundationMotion:一套完全不依賴人工標注的自動化數據管線。

      令人驚訝的是,僅靠這套管線生成的數據微調后,15B 參數的視頻模型竟在運動理解任務上,超越了 Gemini-2.5 Flash 以及 72B 參數的開源大模型:NVILA-Video-15B: 90.6% on AV-Car benchmark, Gemini-2.5-Flash: 84.1%,Qwen-2.5-VL-72B: 83.3%



      • 項目主頁: https://yulugan.com/projects/FoundationMotion.html
      • 論文: https://arxiv.org/abs/2512.10927
      • 代碼: https://github.com/Wolfv0/FoundationMotion

      視頻模型的 “物理盲” 危機

      2024 年至今,被認為是視頻生成模型的爆發期。從 OpenAI 的 Sora 到各類國產模型,AI 已經能夠生成極其逼真的動態畫面。然而,在華麗的像素背后,一個長期被忽視的問題逐漸暴露出來:

      這些模型并不真正理解物體的運動。

      例如,在測試中研究人員發現:

      • 它們可以生成高速行駛的賽車,卻難以判斷剎車究竟是發生在碰撞之前還是之后;
      • 它們能描繪復雜的街景,卻常常搞錯行人的移動方向與相對位置關系。

      比如我們上傳一段一輛汽車在夜間行駛,變道,超過了前方車輛的視頻給 Gemini 3 Pro Preview,問 “What is the primary driving behavior demonstrated by the ego vehicle in the video?”





      Gemini 3 Pro Preview 的回答是這輛車正在它的車道上行駛,完全沒有理解這個視頻最主要的運動:變道與超車。

      正如心理學家 Barbara Tversky 在《Mind in Motion》中所指出的:空間與運動是人類理解世界的基礎。而這一能力,恰恰是當前視頻模型最薄弱的部分。



      問題的根源在于數據。現有視頻數據要么只包含靜態描述(如 “一只狗在草地上”),要么高度依賴昂貴、難以擴展的人工標注,使得大規模、細粒度的 “運動理解” 數據幾乎無法獲得。

      FoundationMotion

      一座全自動的 “運動數據工廠”

      為了解決這一瓶頸,研究團隊提出了 FoundationMotion——一套端到端、無需人工參與的自動化數據生成系統。

      它的工作流程可以被形象地拆解為四步:



      1 & 2. 預處理 & 先把 “運動” 精確地抓出來

      首先,使用成熟的目標檢測與跟蹤模型,對視頻進行逐幀分析,將人、車輛、手部、機械臂等關鍵物體轉化為連續的時空軌跡(Trajectories)。

      • 輸入: 任何視頻。
      • 輸出: 每個物體在視頻中的精確運動坐標。

      2. 把軌跡 “講給” 語言模型聽

      僅有數字坐標對語言模型來說過于抽象,FoundationMotion 采用了多模態融合策略:

      • 將軌跡轉化為結構化的文本描述;
      • 同時將視頻幀與軌跡信息作為 Prompt 輸入。

      這相當于為模型提供了一份 “運動說明書”,讓它不僅看到畫面,還能結合坐標理解物體究竟是如何移動的。

      3. 讓模型生成標注與問題

      研究團隊利用 GPT-4o-mini,在軌跡與視頻的基礎上,自動生成兩類高質量數據:

      • 精細化運動描述:包含速度變化、方向、終止位置等細節;
      • 多維度運動理解問答:覆蓋動作識別、時序關系、動作 - 物體關聯、空間位置以及重復計數等關鍵能力。

      最終,團隊基于 InternVid 構建了約50 萬條高質量運動理解數據,形成了 FoundationMotion 數據集。

      數據樣例:

      小模型,擊敗大模型

      在實驗環節,研究人員使用 FoundationMotion 生成的數據微調了多個開源視頻模型,包括 NVILA-Video-15B 與 Qwen2.5-7B。

      結果顯示,高質量數據帶來的提升是巨大的:

      • 越級挑戰: 微調后的 7B/15B 模型在多個運動理解基準上,超越了 Gemini-2.5 Flash 與 Qwen2.5-VL-72B。
      • 純數據驅動: 這一提升不依賴額外的模型結構設計或復雜的推理策略,完全歸功于數據的質量。
      • 強泛化性: 在自動駕駛、機器人操作、日常活動等不同領域均具備良好表現。
      • 無損通用能力: 在增強物理感知的同時,并未損害模型原本的通用視頻理解能力。

      通向 “物理 AI” 的關鍵一步

      FoundationMotion 的意義遠不止于刷榜。

      在自動駕駛與機器人領域,“理解物體如何運動” 直接關系到系統的安全與決策能力。

      FoundationMotion 提供了一條低成本、可擴展的路徑,讓 AI 能夠通過觀看海量視頻,逐步建立對物理世界的直覺。這套管線未來可廣泛用于:

      • 視覺語言模型(VLM)
      • 視覺 - 語言 - 動作模型(VLA)
      • 世界模型(World Models)

      這被認為是構建真正的具身智能(Embodied AI)的基礎設施。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      下個月,重慶將有10天連續不限行!

      下個月,重慶將有10天連續不限行!

      魯中晨報
      2026-01-23 14:51:10
      吉娜的身材一言難盡,腿型好難看,內衣墊子太多了,看著很假!

      吉娜的身材一言難盡,腿型好難看,內衣墊子太多了,看著很假!

      小娛樂悠悠
      2026-01-23 10:02:08
      丁蘭給江青接生第二天,江青找到她:真是對不起你,請你原諒

      丁蘭給江青接生第二天,江青找到她:真是對不起你,請你原諒

      搜史君
      2026-01-13 07:45:06
      廣東周日氣溫回升,有小雨!下周一夜間將迎新一股弱冷空氣

      廣東周日氣溫回升,有小雨!下周一夜間將迎新一股弱冷空氣

      南方都市報
      2026-01-23 13:58:09
      買家2395萬元拍到法拍房后悔拍,白白損失155萬元保證金,平臺:保證金不會退,其也不得再次參加競買

      買家2395萬元拍到法拍房后悔拍,白白損失155萬元保證金,平臺:保證金不會退,其也不得再次參加競買

      極目新聞
      2026-01-23 12:57:50
      演員黃景瑜將上太空旅游,穿越者公司:選他是因為他以硬漢形象著稱,公司愿景是實現大眾的太空夢

      演員黃景瑜將上太空旅游,穿越者公司:選他是因為他以硬漢形象著稱,公司愿景是實現大眾的太空夢

      極目新聞
      2026-01-23 12:57:50
      經濟不景氣,什么行業最賺錢?當年日本經濟泡沫給出了答案

      經濟不景氣,什么行業最賺錢?當年日本經濟泡沫給出了答案

      泠泠說史
      2026-01-22 18:46:47
      我在兒子家養老8年,故意把90萬存款全給女兒,兒媳的話讓我意外

      我在兒子家養老8年,故意把90萬存款全給女兒,兒媳的話讓我意外

      荷蘭豆愛健康
      2026-01-23 14:23:48
      日元劇烈反彈!市場懷疑官方出手,日本財務大臣拒絕承認:“時刻保持緊迫關注”

      日元劇烈反彈!市場懷疑官方出手,日本財務大臣拒絕承認:“時刻保持緊迫關注”

      華爾街見聞官方
      2026-01-23 18:56:36
      在長江“終點”守望生命“起點”:上海與一尾鱘的“生態之約”

      在長江“終點”守望生命“起點”:上海與一尾鱘的“生態之約”

      上觀新聞
      2026-01-23 11:51:20
      目睹80歲父親臨終的經歷后,我才明白:有些病不治才是最大的孝順

      目睹80歲父親臨終的經歷后,我才明白:有些病不治才是最大的孝順

      小馬達情感故事
      2025-12-14 18:55:03
      從全球第一到業績腰斬!公牛集團被房地產拖垮,十幾億準備跑路

      從全球第一到業績腰斬!公牛集團被房地產拖垮,十幾億準備跑路

      小熊侃史
      2026-01-08 07:55:06
      高中,你不知道的幾個潛規則:中等生就是默認被放棄的群體!

      高中,你不知道的幾個潛規則:中等生就是默認被放棄的群體!

      好爸育兒
      2026-01-22 22:13:24
      看見佟麗婭大腿上那兩道線條了嗎?

      看見佟麗婭大腿上那兩道線條了嗎?

      小光侃娛樂
      2026-01-03 15:40:02
      恥辱性一戰!韓國隊8:9不敵十人越南,韓喬生:韓國足球恥辱性一夜

      恥辱性一戰!韓國隊8:9不敵十人越南,韓喬生:韓國足球恥辱性一夜

      林子說事
      2026-01-24 08:58:12
      以后這4種房子將會淪為“窮人房”,不好住又賣不掉,趁早抽身!

      以后這4種房子將會淪為“窮人房”,不好住又賣不掉,趁早抽身!

      室內設計師有料兒
      2026-01-23 19:20:06
      新一代小米SU7,預售半月訂單近10萬

      新一代小米SU7,預售半月訂單近10萬

      魯中晨報
      2026-01-23 16:15:27
      湖北一男子勇救落水女,3個月后卻將女子殺害,真相讓人冒出冷汗

      湖北一男子勇救落水女,3個月后卻將女子殺害,真相讓人冒出冷汗

      談史論天地
      2026-01-21 18:30:03
      原來早已不是中國籍?事業巔峰遠赴美國,被老外“玩膩”晚年回國

      原來早已不是中國籍?事業巔峰遠赴美國,被老外“玩膩”晚年回國

      興史興談
      2026-01-23 03:06:23
      央視為“嫣然”發聲了,短短15個字,道盡了李亞鵬的辛酸

      央視為“嫣然”發聲了,短短15個字,道盡了李亞鵬的辛酸

      娛樂故事
      2026-01-22 22:23:56
      2026-01-24 10:12:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12179文章數 142549關注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      32歲程序員周末猝死 妻子:公司至今未出面做任何解釋

      頭條要聞

      32歲程序員周末猝死 妻子:公司至今未出面做任何解釋

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      演員孫濤澄清閆學晶言論 落淚維護妻子

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      主打家庭大六座 奕境首款SUV將北京車展亮相

      態度原創

      健康
      教育
      親子
      家居
      時尚

      耳石脫落為何讓人天旋地轉+惡心?

      教育要聞

      網友炸了!“這么糟蹋親生女兒?”父親上傳女兒的生活視頻

      親子要聞

      這種心態要教孩子

      家居要聞

      在家度假 160平南洋混搭宅

      不一定能掀桌男主,但一定是個好演員!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 孕妇高潮太爽了在线观看免费| 亚洲精品天堂一区二区| 亚洲色大成网站www永久一区| 亚洲熟女精品中文字幕m| 国产精品麻豆成人AV电影艾秋| 日本一区二区三区四区黄色| 人妻少妇精品中文字幕av蜜桃| chinese极品人妻videos| 天堂av成人国产精品| 日本丰满少妇xxxx| 石首市| 欧美激情精品久久| 五月综合久久| xxx综合网| 熟女网址| 2020国产精品精品国产| 国产区成人精品视频| 乱子伦农村xxxxbbb| 精品香蕉一区二区三区| 视频一区二区三区四区不卡| 国产成人综合欧美精品久久| 五月婷婷成人| 亚洲av成人在线| 成人超碰最大网站| 亚洲伊人成人| 黑人一区| 波多野结衣一区二区三区高清| 国产精品久久欧美久久一区| 九九久久国产精品大片| 亚洲精品tv久久久久久久| 欧美放荡的少妇| 亚洲成av人片天堂网无码 | 欧美成人精品高清在线播放| 狠狠躁夜夜躁人人爽天天天天97| 亚洲精品久久一区二区无卡| 国产av麻豆mag剧集| 宜章县| 一本色道久久综合无码人妻 | 亚洲精品资源在线观看| 久久综合激情网| 国产av国片精品|