<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      別被「更像真的視頻」騙了,AI視頻生成,還遠未真正學會物理世界

      0
      分享至



      這兩年,視頻生成模型進步很快。清晰度更高了,鏡頭更穩(wěn)了,人物和場景看上去也越來越自然。很多時候,我們判斷一個模型強不強,看的就是它 “像不像真的”。但這其實只回答了一半的問題:它看起來像真的,不代表它真的符合現(xiàn)實世界的物理規(guī)律。這件事放在短視頻生成里,也許只是 “偶爾有點怪”;但如果視頻模型真的要往 world model、仿真系統(tǒng)、具身智能這些方向走,問題就不一樣了。一個模型如果連物體怎么接觸、狀態(tài)怎么變化、事件怎么按因果順序發(fā)生都搞不清楚,那它再像,也只是像。



      現(xiàn)在的視頻評測,更像是在比 “好不好看”

      目前,視頻生成領(lǐng)域常見的評測方式,要么看自動指標,要么讓人直接選 “哪個視頻更好”。這種方式當然有意義,它能比較清晰度、流暢度、觀感這些東西,但它很難告訴你:視頻里到底有沒有違反基本物理常識

      比如,一個物體是不是無緣無故消失了;兩個東西是不是明明沒接觸卻發(fā)生了交互;一個動作的結(jié)果是不是和前面的過程根本對不上。這些問題,才真正關(guān)系到模型是在 “生成一個像真的畫面”,還是在 “模擬一個可信的世界”。

      Physion-Eval:從 “視覺真實” 走向 “物理真實” 的新 benchmark

      這篇工作提出了Physion-Eval。它不是再做一個 “誰的視頻更好看” 的排行榜,而是想認真回答一個更關(guān)鍵的問題:AI 生成的視頻,在物理層面到底有多真實



      • 論文標題: Physion-Eval: Evaluating Physical Realism in Generated Video via Human Reasoning
      • 作者: Qin Zhang, Peiyu Jing, Hong-Xing Yu, Fangqiang Ding, Fan Nie, Weimin Wang, Yilun Du, James Zou, Jiajun Wu, and Bing Shuai
      • 作者單位:Physion Labs,斯坦福大學,MIT,哈佛大學,Character AI
      • 論文鏈接: https://arxiv.org/abs/2603.19607
      • 數(shù)據(jù)集鏈接: https://huggingface.co/datasets/PhysionLabs/Physion-Eval
      • 視頻鏈接:https://www.youtube.com/watch?v=Vbn_W3WNUHw

      這個 benchmark 同時覆蓋第一人稱和第三人稱場景,包含10,990 條專家推理軌跡,覆蓋22 類細粒度物理現(xiàn)象。和常見評測不太一樣的地方在于,這里的每條樣本不只是簡單打個分,而是會標出錯誤發(fā)生在什么時候、屬于哪一類問題,以及為什么不對

      數(shù)據(jù)上,第三人稱部分來自WISA-80K,第一人稱部分基于EPIC-KITCHENS構(gòu)建。為了保證標注質(zhì)量,論文組織了90 位具有 STEM 背景并接受過本科物理訓練的專家標注者,采用雙人標注和資深專家裁決的流程,最后得到的是帶時間戳、錯誤類別和文字解釋的高質(zhì)量標注。

      在這一過程中,人類智能所展現(xiàn)出的優(yōu)勢尤為明顯:人類不僅能夠識別視覺上的異常,更能夠基于物理直覺與因果理解,對復雜的動態(tài)過程進行推理和解釋。相比之下,即使是當前最先進的多模態(tài)模型,在時序一致性、交互合理性以及隱含物理規(guī)律的判斷上,仍存在明顯不足。





      最直接的結(jié)論:現(xiàn)在的模型,還遠談不上 “物理一致”

      這篇工作的主結(jié)論其實很簡單,也很扎眼:在物理過程敏感的場景里,83.3% 的第三人稱生成視頻和 93.5% 的第一人稱生成視頻,都至少包含一個人類可以明確識別的物理錯誤。這說明什么?說明今天的視頻模型確實越來越會制造 “真實感” 了,但離 “真正符合物理規(guī)律” 還有很遠。



      而且這些錯誤不是零零散散的小毛病,而是系統(tǒng)性的。論文里總結(jié)的典型問題包括:接觸或交互失敗、對象突然出現(xiàn)或消失、時間連貫性崩塌、因果順序錯亂、材料或狀態(tài)變化異常、幾何碰撞不合理等等。換句話說,問題不只是 “畫面有點假”,而是模型對物體、接觸、運動和結(jié)果之間最基本的關(guān)系,還經(jīng)常搞錯。



      很多錯誤不是粗糙,而是 “看著像,但其實完全不對”

      Physion-Eval 里最有意思的地方,其實是那些具體例子。它們不是那種一眼就看出來的低級 bug,而是第一眼好像還行,仔細一想?yún)s明顯不符合常識。

      比如,桌面上突然多出一把本來不存在的刀;瓶口朝下,液體卻不往下流;水直接穿過鍋底;又或者一個鍋被兩根手指以幾乎不可能的方式拎起來。它們的問題不在于 “渲染不精細”,而在于直接違背了物體守恒、重力、不可穿透性和穩(wěn)定接觸這些最基本的物理規(guī)律。

      這也是為什么我們覺得,這項工作不只是 “又多了一個 benchmark”。它更像是在提醒大家:今天很多模型也許已經(jīng)很會生成 “像真的視頻”,但還遠沒有學會 “世界為什么會這樣動”。





      更麻煩的是,連最強的多模態(tài)模型也不太會看這些錯誤

      論文還問了另一個很現(xiàn)實的問題:那能不能讓現(xiàn)在的大模型來當 “自動評委”,替人判斷一個視頻有沒有物理問題?

      答案是,暫時還不行。

      文章評估了10 個開源和閉源的 MLLM critic,結(jié)果顯示,它們和人類判斷之間還有明顯差距。以Gemini 3.0 Pro為例,它會漏掉超過74.4% 的第三人稱錯誤視頻和 90.1% 的第一人稱錯誤視頻。而且它們不只是漏檢,還會把錯誤發(fā)生的時間說錯,甚至編出根本不存在的原因。

      這點其實很關(guān)鍵。因為如果以后大家真想靠自動 critic 去評估 world model 或視頻生成系統(tǒng),那 critic 本身至少得先真的看懂視頻里的物理過程。就目前來看,人類判斷依然是最可靠的標準。









      越是高動態(tài)的物理過程,越容易暴露當前模型的短板

      論文進一步從physical intensitydynamics兩個維度分析了生成模型與市面上已有的 MLLM critic 的表現(xiàn)。結(jié)果表明,相比強度大小,過程本身的動態(tài)性和復雜性更容易暴露視頻生成模型的物理建模缺陷。對 MLLM critic 來說也是如此:只有當錯誤足夠明顯時,它們才會表現(xiàn)出有限的判斷能力,但整體仍明顯落后于人類。







      總結(jié)

      Physion-Eval 想指出的,不只是 “現(xiàn)在的視頻生成模型還不夠強”,而是一個更根本的問題:當行業(yè)越來越關(guān)注視頻 “看起來有多真” 的時候,我們可能忽略了它 “實際上對不對”

      對于真正想做 world model、機器人、具身智能和仿真的人來說,這個問題繞不過去。畫面更清晰、動作更順滑,當然重要;但如果物體會無故出現(xiàn),液體不會往下流,動作結(jié)果和前因?qū)Σ簧希悄P途瓦€沒有真正學會世界的運行方式。

      視頻生成下一階段,也許不該只繼續(xù)卷觀感,而應(yīng)該更認真地去解決物體持續(xù)性、接觸關(guān)系、狀態(tài)變化、時序一致性和因果結(jié)構(gòu)這些更本質(zhì)的問題。“看起來對”,從來不等于 “實際上對”

      作者介紹

      本文由來自美國頂級科技公司與世界一流高校的豪華作者陣容共同完成,集結(jié) Physion Labs、斯坦福大學、MIT、哈佛大學及 Character AI 的核心研究者。其中,Physion Labs 團隊(Qin Zhang、Peiyu Jing、Bing Shuai)長期專注于生成式視頻與世界模型中的物理一致性問題,構(gòu)建了面向行業(yè)的評估基礎(chǔ)設(shè)施與數(shù)據(jù)閉環(huán),致力于成為下一代生成模型的 “物理可信層”。其余作者包括斯坦福大學的 Hong-Xing Yu、Fan Nie、James Zou、Jiajun Wu,麻省理工學院的 Fangqiang Ding,哈佛大學的 Yilun Du,以及 Character AI 的 Weimin Wang 等業(yè)內(nèi)頂尖學者。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      特朗普精力充沛,養(yǎng)生秘訣是吃大量阿司匹林,日常三餐吃麥當勞

      特朗普精力充沛,養(yǎng)生秘訣是吃大量阿司匹林,日常三餐吃麥當勞

      南權(quán)先生
      2026-04-04 05:05:03
      廣東隊三連勝,球隊調(diào)整賽季目標,杜鋒技術(shù)犯規(guī)被重罰

      廣東隊三連勝,球隊調(diào)整賽季目標,杜鋒技術(shù)犯規(guī)被重罰

      孤影來客
      2026-04-05 18:14:00
      金莎肚子大到藏不住?車展現(xiàn)身被疑懷孕,聲音變粗更添實錘!

      金莎肚子大到藏不住?車展現(xiàn)身被疑懷孕,聲音變粗更添實錘!

      情感大頭說說
      2026-04-03 00:10:45
      斷更五個月!知名網(wǎng)紅董赤赤發(fā)聲,患嚴重抑郁,還遭導演惡意引導

      斷更五個月!知名網(wǎng)紅董赤赤發(fā)聲,患嚴重抑郁,還遭導演惡意引導

      裕豐娛間說
      2026-04-04 19:21:13
      “我毫無優(yōu)勢” 趙心童回應(yīng)賠率看好他掀翻世界第1 生涯獎金909萬

      “我毫無優(yōu)勢” 趙心童回應(yīng)賠率看好他掀翻世界第1 生涯獎金909萬

      風過鄉(xiāng)
      2026-04-05 09:35:40
      沉默3天,北京迎來一位貴客,見面先握緊中方手,特朗普又賭輸了

      沉默3天,北京迎來一位貴客,見面先握緊中方手,特朗普又賭輸了

      愛意隨風起呀
      2026-04-05 19:28:20
      突發(fā) 張雪ADV350踏板最新進展曝光 雙缸+輻條輪轂 PPT終于變真車

      突發(fā) 張雪ADV350踏板最新進展曝光 雙缸+輻條輪轂 PPT終于變真車

      沙雕小琳琳
      2026-04-05 17:25:40
      2019年,滴滴司機鐘元被執(zhí)行死刑,死前害怕不已,跪地不停懺悔

      2019年,滴滴司機鐘元被執(zhí)行死刑,死前害怕不已,跪地不停懺悔

      南宗歷史
      2026-03-17 01:08:53
      超級大富豪被拉黑,數(shù)千億大案曝光了

      超級大富豪被拉黑,數(shù)千億大案曝光了

      大貓財經(jīng)Pro
      2026-04-03 18:12:24
      美軍突然不會打仗了!飛行員還沒有找到,在伊朗度過艱難的24小時

      美軍突然不會打仗了!飛行員還沒有找到,在伊朗度過艱難的24小時

      Ck的蜜糖
      2026-04-04 14:45:19
      A股:周日中午突發(fā)3大消息!A股或史詩級別調(diào)整浪行情?

      A股:周日中午突發(fā)3大消息!A股或史詩級別調(diào)整浪行情?

      股市皆大事
      2026-04-05 12:46:28
      一人毀掉整個國家?內(nèi)塔尼亞胡用戰(zhàn)爭自救,國家正為他的自私買單

      一人毀掉整個國家?內(nèi)塔尼亞胡用戰(zhàn)爭自救,國家正為他的自私買單

      三石記
      2026-04-05 18:54:54
      北京這天,魯豫瘦成麻桿,張豐毅白發(fā)老態(tài),被打扮得體的周濤搶鏡

      北京這天,魯豫瘦成麻桿,張豐毅白發(fā)老態(tài),被打扮得體的周濤搶鏡

      青橘罐頭
      2026-04-04 12:10:43
      中紀委通報:211 副校長、醫(yī)科大學書記、原教育廳廳長等多人被查

      中紀委通報:211 副校長、醫(yī)科大學書記、原教育廳廳長等多人被查

      生物學霸
      2026-04-05 17:08:28
      不邀請中國參加G7峰會 馬克龍為何改主意了?

      不邀請中國參加G7峰會 馬克龍為何改主意了?

      看看新聞Knews
      2026-04-04 17:51:02
      房價要變天了?不出意外,2026年二手房價格會迎來4大轉(zhuǎn)變

      房價要變天了?不出意外,2026年二手房價格會迎來4大轉(zhuǎn)變

      小談食刻美食
      2026-04-05 10:35:01
      54歲瞿穎已婚實錘!丈夫身份曝光超意外

      54歲瞿穎已婚實錘!丈夫身份曝光超意外

      眼底星碎
      2026-03-26 13:47:18
      真正的聰明,是學會“躲”著過日子

      真正的聰明,是學會“躲”著過日子

      青蘋果sht
      2026-04-03 05:52:19
      回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風韻猶存

      回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風韻猶存

      素衣讀史
      2026-03-31 15:11:31
      大伯嫌爺爺累贅,把他趕到我家養(yǎng)老,爺爺晚上:乖孫,給你樣東西

      大伯嫌爺爺累贅,把他趕到我家養(yǎng)老,爺爺晚上:乖孫,給你樣東西

      凱裕說故事
      2025-05-04 08:05:09
      2026-04-05 21:27:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12681文章數(shù) 142613關(guān)注度
      往期回顧 全部

      科技要聞

      花200薅5千算力,Claude冷血斷供“龍蝦”

      頭條要聞

      AI替去世兒子撒了最后一次謊:等我賺到錢就回來孝順你

      頭條要聞

      AI替去世兒子撒了最后一次謊:等我賺到錢就回來孝順你

      體育要聞

      CBA最老球員,身價7500萬美元

      娛樂要聞

      王燦兮否認婆媳不和 曬與杜淳媽合影

      財經(jīng)要聞

      誰造出了優(yōu)思益這頭“怪物”?

      汽車要聞

      家用SUV沒駕駛樂趣?極氪8X第一個不同意

      態(tài)度原創(chuàng)

      家居
      數(shù)碼
      親子
      公開課
      軍事航空

      家居要聞

      溫馨多元 愛的具象化

      數(shù)碼要聞

      小米免費送10萬個SU7定制直飲杯:小米之家、小米商城可領(lǐng)

      親子要聞

      清明時節(jié),混血姐弟倆今天不比武,背誦古詩!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美飛行員獲救細節(jié):美伊發(fā)生激烈交火 至少4死1傷

      無障礙瀏覽 進入關(guān)懷版