<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Adobe公司推出RELIC:游戲引擎實(shí)現(xiàn)20秒長(zhǎng)時(shí)記憶

      0
      分享至


      這項(xiàng)由Adobe公司的Yicong Hong、Yiqun Mei、Chongjian Ge等研究人員領(lǐng)導(dǎo)的突破性研究發(fā)表于2025年12月1日,論文編號(hào)為arXiv:2512.04040v1。有興趣深入了解的讀者可以通過(guò)該編號(hào)查詢完整論文。

      說(shuō)起視頻游戲,我們都習(xí)慣了這樣的體驗(yàn):你在一個(gè)虛擬世界里四處走動(dòng),看過(guò)的風(fēng)景、探索過(guò)的角落,當(dāng)你再次回到那里時(shí),一切都還在原地等著你。但如果要用人工智能來(lái)生成這樣的世界,就變成了一個(gè)超級(jí)復(fù)雜的挑戰(zhàn)。就好比你要求一個(gè)畫家一邊畫畫,一邊記住他之前畫過(guò)的每一個(gè)細(xì)節(jié),還要保證畫面連續(xù)流暢,不能有任何斷層。

      Adobe的研究團(tuán)隊(duì)開(kāi)發(fā)出了一個(gè)叫做RELIC的系統(tǒng),它可以從一張靜止圖片開(kāi)始,創(chuàng)造出一個(gè)你可以實(shí)時(shí)探索的虛擬世界。這就像是給了你一張風(fēng)景照,然后神奇地讓你能夠走進(jìn)照片里,四處看看,甚至20秒后回到原來(lái)的位置,發(fā)現(xiàn)之前看到的那棵樹(shù)、那棟房子都還完好地在那里。

      這項(xiàng)研究解決了一個(gè)困擾人工智能領(lǐng)域很久的問(wèn)題:如何讓AI生成的視頻世界既能實(shí)時(shí)響應(yīng)用戶操作,又能準(zhǔn)確記住之前生成過(guò)的內(nèi)容。傳統(tǒng)的AI視頻生成就像一個(gè)健忘的導(dǎo)游,每次帶你參觀都是全新的體驗(yàn),完全不記得上次你們一起看過(guò)什么。而RELIC就像一個(gè)記憶超群的導(dǎo)游,不僅能實(shí)時(shí)響應(yīng)你的需求,還能準(zhǔn)確記住你們之前探索過(guò)的每一個(gè)地方。

      一、游戲世界的記憶難題

      要理解RELIC解決的問(wèn)題,可以把它比作經(jīng)營(yíng)一家主題公園。一個(gè)普通的主題公園,游客只能按照固定路線參觀,看到的都是事先準(zhǔn)備好的景點(diǎn)。但RELIC要?jiǎng)?chuàng)建的是一個(gè)"魔法主題公園",游客可以自由選擇方向,想去哪里就去哪里,而且當(dāng)他們重新回到之前參觀過(guò)的地方時(shí),那里的一切都應(yīng)該和上次看到的完全一樣。

      傳統(tǒng)的AI視頻生成面臨三個(gè)核心挑戰(zhàn),就像三個(gè)必須同時(shí)解決的魔法咒語(yǔ)。第一個(gè)咒語(yǔ)是"實(shí)時(shí)響應(yīng)",意思是當(dāng)用戶按下鍵盤想要向左轉(zhuǎn)時(shí),視頻必須立即生成向左轉(zhuǎn)的畫面,不能讓用戶等待。第二個(gè)咒語(yǔ)是"長(zhǎng)期記憶",也就是說(shuō),當(dāng)用戶在虛擬世界里兜了一大圈又回到起點(diǎn)時(shí),起點(diǎn)的景象必須和最初看到的完全一致。第三個(gè)咒語(yǔ)是"精確控制",用戶想要向上看天空、向下看地面,或者快速移動(dòng)、緩慢移動(dòng),系統(tǒng)都必須準(zhǔn)確理解并執(zhí)行。

      問(wèn)題在于,這三個(gè)咒語(yǔ)往往會(huì)相互沖突。想要實(shí)現(xiàn)長(zhǎng)期記憶,就需要存儲(chǔ)大量的歷史信息,這會(huì)嚴(yán)重拖慢系統(tǒng)速度,影響實(shí)時(shí)響應(yīng)。想要精確控制,就需要復(fù)雜的計(jì)算,這又會(huì)消耗更多資源。就好比你要求一個(gè)人一邊快速奔跑,一邊背誦所有看到過(guò)的東西,還要隨時(shí)準(zhǔn)確回應(yīng)你的各種指令,這幾乎是不可能完成的任務(wù)。

      RELIC的創(chuàng)新之處在于找到了一種巧妙的平衡方案。它就像一個(gè)聰明的圖書管理員,不是把所有書都放在手邊,而是建立了一套高效的索引系統(tǒng)。當(dāng)需要某本書時(shí),能夠迅速找到并取出,平時(shí)則把書整理壓縮存放,節(jié)省空間又保證效率。

      二、雙師制教學(xué)的創(chuàng)新架構(gòu)

      RELIC采用了一種類似"雙師制教學(xué)"的方法來(lái)訓(xùn)練AI模型。在這個(gè)比喻中,有一位"資深教師"和一位"實(shí)習(xí)教師"。資深教師學(xué)識(shí)淵博,能夠生成高質(zhì)量的20秒長(zhǎng)視頻,但工作節(jié)奏比較慢。實(shí)習(xí)教師學(xué)習(xí)能力強(qiáng),工作速度快,但經(jīng)驗(yàn)不足。RELIC的目標(biāo)就是讓實(shí)習(xí)教師通過(guò)學(xué)習(xí)資深教師的知識(shí),最終能夠快速生成同樣高質(zhì)量的視頻。

      這個(gè)雙師制的核心在于一個(gè)叫做"自我強(qiáng)化學(xué)習(xí)"的過(guò)程。就好比學(xué)開(kāi)車時(shí),教練不僅會(huì)示范正確的駕駛方式,還會(huì)讓學(xué)生自己開(kāi)車,然后根據(jù)實(shí)際駕駛情況給出指導(dǎo)。RELIC的實(shí)習(xí)教師在學(xué)習(xí)過(guò)程中,不僅要模仿資深教師的輸出結(jié)果,還要在自己生成視頻的過(guò)程中不斷自我糾正,逐步改善。

      資深教師的優(yōu)勢(shì)在于能夠處理長(zhǎng)時(shí)間的視頻序列。傳統(tǒng)的AI模型通常只能處理5秒左右的短視頻,就像只能背誦短詩(shī)的學(xué)生。但RELIC的資深教師經(jīng)過(guò)特殊訓(xùn)練,能夠處理長(zhǎng)達(dá)20秒的視頻序列,這為整個(gè)系統(tǒng)提供了強(qiáng)大的"長(zhǎng)期記憶"基礎(chǔ)。這種擴(kuò)展是通過(guò)一種叫做"課程學(xué)習(xí)"的方法實(shí)現(xiàn)的,先從5秒開(kāi)始訓(xùn)練,然后逐漸增加到10秒、20秒,就像體能訓(xùn)練時(shí)逐漸增加運(yùn)動(dòng)強(qiáng)度一樣。

      更關(guān)鍵的是,資深教師在學(xué)習(xí)過(guò)程中不僅要掌握視頻生成技巧,還要學(xué)會(huì)理解用戶的控制指令。研究團(tuán)隊(duì)設(shè)計(jì)了一套13維的動(dòng)作空間,涵蓋了用戶可能做出的各種操作:前進(jìn)、后退、左移、右移、上升、下降等6種平移動(dòng)作,以及上看、下看、左轉(zhuǎn)、右轉(zhuǎn)等6種旋轉(zhuǎn)動(dòng)作,再加上一個(gè)"靜止"指令。這就像為司機(jī)設(shè)計(jì)了一套完整的操控系統(tǒng),不僅有方向盤和油門剎車,還有各種輔助控制按鈕。

      三、壓縮記憶的魔法技術(shù)

      RELIC最巧妙的創(chuàng)新在于它的記憶管理系統(tǒng),這就像一個(gè)超級(jí)智能的壓縮軟件,能夠在保留關(guān)鍵信息的同時(shí)大幅節(jié)省存儲(chǔ)空間。當(dāng)你在虛擬世界中移動(dòng)時(shí),RELIC會(huì)將你看過(guò)的畫面進(jìn)行高度壓縮,然后存儲(chǔ)在一個(gè)叫做"KV緩存"的特殊存儲(chǔ)空間里。

      這個(gè)壓縮過(guò)程可以比作一個(gè)專業(yè)攝影師整理照片的方式。攝影師不會(huì)保留每張照片的全部原始數(shù)據(jù),而是會(huì)根據(jù)照片的重要性和使用頻率,保留不同清晰度的版本。最近拍攝的照片保持最高清晰度,稍微久遠(yuǎn)一些的照片進(jìn)行適度壓縮,而很早之前的照片則進(jìn)行大幅壓縮但仍然保留關(guān)鍵特征。

      RELIC的記憶系統(tǒng)包含兩個(gè)部分:滾動(dòng)窗口緩存和壓縮的長(zhǎng)期空間記憶緩存。滾動(dòng)窗口緩存就像你的短期記憶,存儲(chǔ)最近幾幀的完整信息,確保畫面的連續(xù)性和流暢性。而壓縮的長(zhǎng)期空間記憶緩存則像你的長(zhǎng)期記憶,存儲(chǔ)經(jīng)過(guò)特殊處理的歷史信息。

      這種壓縮不是簡(jiǎn)單的縮小圖片,而是一種智能的信息提取。系統(tǒng)會(huì)保留每個(gè)位置的相機(jī)姿態(tài)信息,包括相對(duì)動(dòng)作和絕對(duì)位置。相對(duì)動(dòng)作告訴系統(tǒng)"我從這里向左移動(dòng)了多遠(yuǎn)",而絕對(duì)位置則提供"我現(xiàn)在在世界坐標(biāo)系中的確切位置"。當(dāng)用戶回到之前探索過(guò)的位置時(shí),系統(tǒng)就能通過(guò)這些位置信息快速檢索出對(duì)應(yīng)的壓縮記憶,然后重建出相應(yīng)的畫面。

      更令人驚嘆的是,RELIC能夠?qū)⒖偟挠洃洿鎯?chǔ)量減少到原來(lái)的四分之一,從12萬(wàn)個(gè)記憶單元壓縮到3萬(wàn)個(gè),同時(shí)還能保持畫面的高質(zhì)量和空間一致性。這就像把一整套百科全書壓縮成幾本精華版,但當(dāng)你需要查找任何信息時(shí),仍然能夠快速準(zhǔn)確地找到所需內(nèi)容。

      四、突破性的反向傳播技術(shù)

      在訓(xùn)練RELIC這樣復(fù)雜的系統(tǒng)時(shí),研究團(tuán)隊(duì)遇到了一個(gè)類似"雞生蛋還是蛋生雞"的技術(shù)難題。要訓(xùn)練出能生成20秒長(zhǎng)視頻的AI模型,就需要讓模型在訓(xùn)練過(guò)程中處理20秒的完整視頻序列。但處理如此長(zhǎng)的序列會(huì)消耗大量的計(jì)算資源和內(nèi)存,就像要求一臺(tái)普通電腦同時(shí)運(yùn)行幾十個(gè)大型游戲一樣,根本無(wú)法承受。

      為了解決這個(gè)問(wèn)題,RELIC的研究團(tuán)隊(duì)發(fā)明了一種叫做"重放反向傳播"的技術(shù)。這個(gè)技術(shù)可以比作一個(gè)聰明的考試策略:不是一次性做完所有題目再檢查答案,而是先快速瀏覽所有題目得到大概印象,然后逐題仔細(xì)分析和改正。

      具體來(lái)說(shuō),系統(tǒng)首先會(huì)快速生成整個(gè)20秒的視頻序列,但在這個(gè)過(guò)程中不進(jìn)行復(fù)雜的學(xué)習(xí)計(jì)算,就像先快速瀏覽一遍考試題目。然后,系統(tǒng)會(huì)計(jì)算這個(gè)生成結(jié)果與標(biāo)準(zhǔn)答案之間的差異,并將這些差異信息保存起來(lái)。接下來(lái)的學(xué)習(xí)階段,系統(tǒng)會(huì)回到視頻的開(kāi)頭,逐個(gè)小段地重新生成視頻,同時(shí)使用之前保存的差異信息來(lái)指導(dǎo)學(xué)習(xí)和改進(jìn)。

      這種方法的巧妙之處在于將內(nèi)存消耗從整個(gè)20秒序列的規(guī)模降低到單個(gè)視頻片段的規(guī)模,就像把一個(gè)巨大的難題分解成許多個(gè)小問(wèn)題來(lái)逐一解決。每處理完一個(gè)小段,系統(tǒng)就會(huì)立即釋放相應(yīng)的內(nèi)存資源,然后再處理下一個(gè)小段,這樣就能在有限的硬件資源下完成看似不可能的訓(xùn)練任務(wù)。

      這個(gè)創(chuàng)新不僅解決了內(nèi)存限制問(wèn)題,還保證了學(xué)習(xí)效果。因?yàn)橄到y(tǒng)能夠看到完整的20秒視頻效果,所以學(xué)習(xí)到的知識(shí)是全面和一致的,不會(huì)出現(xiàn)只見(jiàn)樹(shù)木不見(jiàn)森林的局限性。

      五、來(lái)自虛幻引擎的完美訓(xùn)練數(shù)據(jù)

      要訓(xùn)練RELIC這樣的AI系統(tǒng),需要大量高質(zhì)量的訓(xùn)練數(shù)據(jù),就像培養(yǎng)一個(gè)世界級(jí)的廚師需要讓他品嘗和練習(xí)制作各種不同的菜肴一樣。但獲得合適的訓(xùn)練數(shù)據(jù)是一個(gè)巨大的挑戰(zhàn)。現(xiàn)實(shí)世界的視頻雖然真實(shí),但往往缺乏精確的控制信息,而且視角變化有限。游戲錄像雖然有控制信息,但通常局限于特定的游戲風(fēng)格和場(chǎng)景。

      研究團(tuán)隊(duì)采用了一個(gè)創(chuàng)新的解決方案:使用虛幻引擎(Unreal Engine)這個(gè)專業(yè)游戲開(kāi)發(fā)工具來(lái)創(chuàng)建專門的訓(xùn)練數(shù)據(jù)。這就像為培訓(xùn)飛行員而建造一個(gè)完全可控的飛行模擬器,能夠創(chuàng)造各種復(fù)雜的飛行情況和環(huán)境條件。

      團(tuán)隊(duì)精心策劃了350個(gè)高質(zhì)量的3D場(chǎng)景,涵蓋室內(nèi)環(huán)境如家庭、辦公室,以及戶外環(huán)境如森林、山脈、街道等。然后安排人類操作者在這些場(chǎng)景中進(jìn)行導(dǎo)航,使用受物理碰撞約束的相機(jī)控制器來(lái)確保移動(dòng)的真實(shí)性。整個(gè)過(guò)程中,系統(tǒng)會(huì)精確記錄相機(jī)的6自由度運(yùn)動(dòng)軌跡,包括位置、方向和對(duì)應(yīng)的時(shí)間戳。

      最終收集到的數(shù)據(jù)集包含超過(guò)1400條人類控制的相機(jī)軌跡,總時(shí)長(zhǎng)超過(guò)1600分鐘,平均每個(gè)視頻片段約75秒,最長(zhǎng)的可達(dá)9分鐘。這些數(shù)據(jù)的特殊價(jià)值在于動(dòng)作分布的平衡性和路徑的多樣性。真實(shí)世界的視頻往往以前進(jìn)運(yùn)動(dòng)為主,很少有側(cè)移或旋轉(zhuǎn),而RELIC的訓(xùn)練數(shù)據(jù)中包含了均衡分布的各種運(yùn)動(dòng)類型,使AI能夠?qū)W會(huì)響應(yīng)用戶的各種控制指令。

      更重要的是,這些軌跡特意設(shè)計(jì)了大量的"重訪"場(chǎng)景,也就是相機(jī)會(huì)在探索過(guò)程中多次返回之前去過(guò)的位置。這種設(shè)計(jì)對(duì)于訓(xùn)練AI的長(zhǎng)期記憶能力至關(guān)重要,就像教一個(gè)導(dǎo)游不僅要會(huì)帶路,還要能準(zhǔn)確記住每個(gè)景點(diǎn)的特色,在游客要求再次參觀時(shí)能夠保持一致的介紹。

      六、實(shí)時(shí)運(yùn)行的優(yōu)化魔法

      讓RELIC能夠在普通硬件上實(shí)時(shí)運(yùn)行,需要一系列精巧的優(yōu)化技術(shù),就像為一輛高性能跑車進(jìn)行全面的輕量化改造,在保持性能的同時(shí)提高燃油效率。研究團(tuán)隊(duì)采用了多項(xiàng)技術(shù)來(lái)突破計(jì)算和內(nèi)存的瓶頸。

      首先是代碼編譯優(yōu)化。團(tuán)隊(duì)使用了torch.compile技術(shù)來(lái)減少程序運(yùn)行時(shí)的開(kāi)銷,這就像為汽車發(fā)動(dòng)機(jī)安裝更高效的燃油噴射系統(tǒng),讓每一滴燃油都能發(fā)揮最大效用。這種優(yōu)化主要針對(duì)一些基礎(chǔ)的數(shù)學(xué)運(yùn)算模塊,如歸一化處理、旋轉(zhuǎn)位置編碼和調(diào)制層等。

      內(nèi)存管理方面,團(tuán)隊(duì)采用了多項(xiàng)創(chuàng)新措施。他們將KV緩存以FP8 E4M3格式存儲(chǔ),這種格式只使用傳統(tǒng)格式一半的內(nèi)存空間,就像使用更緊湊的包裝方式來(lái)存儲(chǔ)同樣數(shù)量的物品。同時(shí),他們還采用了FlashAttention v3技術(shù)配合FP8內(nèi)核,在NVIDIA H100這樣的新一代GPU上實(shí)現(xiàn)了更好的性能表現(xiàn)。

      更巧妙的是并行化策略。RELIC采用了一種混合的并行化方案,就像指揮一個(gè)大型管弦樂(lè)隊(duì),不同樂(lè)器組負(fù)責(zé)不同的部分,但整體協(xié)調(diào)一致。具體來(lái)說(shuō),線性層和交叉注意力模塊采用序列并行化,也就是將長(zhǎng)序列分割給不同的處理器;而自注意力模塊采用張量并行化,將注意力頭分配給不同的處理器。當(dāng)需要在這兩種并行方式之間切換時(shí),系統(tǒng)使用NCCL All-to-All操作來(lái)重新分布數(shù)據(jù),確保計(jì)算的連續(xù)性。

      通過(guò)這些綜合優(yōu)化,RELIC最終能夠在4張H100 GPU上實(shí)現(xiàn)16幀每秒的實(shí)時(shí)生成速度,同時(shí)保持480×832的高分辨率輸出。這意味著用戶在使用時(shí)幾乎感受不到延遲,能夠獲得流暢的實(shí)時(shí)交互體驗(yàn)。

      七、超越競(jìng)爭(zhēng)對(duì)手的實(shí)驗(yàn)驗(yàn)證

      為了驗(yàn)證RELIC的性能,研究團(tuán)隊(duì)進(jìn)行了全面的對(duì)比實(shí)驗(yàn),就像舉辦一場(chǎng)公平的技能比賽,讓所有參賽者在相同條件下展示各自的能力。他們選擇了當(dāng)前最先進(jìn)的兩個(gè)競(jìng)爭(zhēng)對(duì)手:Matrix-Game-2.0和Hunyuan-GameCraft作為對(duì)比基準(zhǔn)。

      實(shí)驗(yàn)設(shè)計(jì)采用了220張來(lái)自Adobe Stock的測(cè)試圖片,涵蓋現(xiàn)實(shí)場(chǎng)景如風(fēng)景、城市環(huán)境、室內(nèi)空間,以及非現(xiàn)實(shí)場(chǎng)景如卡通、矢量藝術(shù)、油畫等。這些圖片被隨機(jī)分成11組,每個(gè)AI系統(tǒng)都要處理相同的圖片并生成20秒長(zhǎng)度的視頻,然后從視覺(jué)質(zhì)量和動(dòng)作準(zhǔn)確性兩個(gè)維度進(jìn)行評(píng)估。

      在視覺(jué)質(zhì)量方面,RELIC表現(xiàn)出了明顯的優(yōu)勢(shì)。研究團(tuán)隊(duì)使用VBench評(píng)估框架的多個(gè)維度來(lái)衡量視頻質(zhì)量,包括主體一致性、背景一致性、運(yùn)動(dòng)平滑度、動(dòng)態(tài)程度、美學(xué)質(zhì)量和成像質(zhì)量。最終的平均分顯示,RELIC獲得了0.8015分(滿分1分),而Matrix-Game-2.0獲得0.7447分,Hunyuan-GameCraft獲得0.7885分。雖然RELIC的訓(xùn)練分辨率只有480p,但在圖像質(zhì)量方面能夠與在720p數(shù)據(jù)上訓(xùn)練的Hunyuan-GameCraft相媲美,在美學(xué)評(píng)分上甚至表現(xiàn)更優(yōu)。

      動(dòng)作準(zhǔn)確性的測(cè)試更加嚴(yán)格。研究團(tuán)隊(duì)讓所有系統(tǒng)執(zhí)行相同的預(yù)定義動(dòng)作序列,然后使用ViPE技術(shù)從生成的視頻中重建相機(jī)軌跡。通過(guò)Sim(3) Umeyama對(duì)齊消除尺度和坐標(biāo)系差異后,計(jì)算平移和旋轉(zhuǎn)的相對(duì)姿態(tài)誤差(RPE)。結(jié)果顯示,RELIC在平移誤差方面達(dá)到0.0906,旋轉(zhuǎn)誤差為1.00,明顯優(yōu)于其他競(jìng)爭(zhēng)對(duì)手。

      更直觀的對(duì)比體現(xiàn)在實(shí)際使用場(chǎng)景中。當(dāng)用戶想要向上仰視時(shí),Matrix-Game-2.0會(huì)在畫面頂部產(chǎn)生黑色區(qū)域,無(wú)法生成新內(nèi)容;Hunyuan-GameCraft則幾乎沒(méi)有垂直運(yùn)動(dòng)響應(yīng)。而RELIC能夠準(zhǔn)確響應(yīng)指令,生成相應(yīng)的天花板結(jié)構(gòu)和新視角內(nèi)容。當(dāng)用戶想要側(cè)向移動(dòng)時(shí),Hunyuan-GameCraft會(huì)錯(cuò)誤地執(zhí)行旋轉(zhuǎn)動(dòng)作,Matrix-Game-2.0則可能完全靜止不動(dòng),只有RELIC能夠準(zhǔn)確執(zhí)行側(cè)向平移并揭示正確的視角變化。

      八、多樣化應(yīng)用的驚人潛力

      RELIC的能力遠(yuǎn)超傳統(tǒng)的視頻生成系統(tǒng),展現(xiàn)出了令人驚嘆的多樣性和適應(yīng)性。它不僅能夠處理常規(guī)的室內(nèi)外真實(shí)環(huán)境,還能夠在各種藝術(shù)風(fēng)格中游刃有余,包括油畫、漫畫插圖、矢量藝術(shù)、低多邊形渲染等多種視覺(jué)風(fēng)格。這種泛化能力就像一個(gè)多才多藝的演員,能夠在不同類型的電影中都表現(xiàn)出色。

      特別值得注意的是RELIC的距離感知能力。在生成的視頻中,遠(yuǎn)處的建筑和景物移動(dòng)速度較慢,而近處的物體移動(dòng)速度較快,完全符合真實(shí)世界的視覺(jué)規(guī)律。這種細(xì)節(jié)處理顯示了系統(tǒng)對(duì)3D空間結(jié)構(gòu)的深度理解,不是簡(jiǎn)單的2D圖像處理,而是真正理解了三維世界的幾何關(guān)系。

      速度控制是RELIC的另一個(gè)突出特色。由于采用了連續(xù)數(shù)值而非二進(jìn)制標(biāo)志來(lái)表示動(dòng)作強(qiáng)度,用戶可以通過(guò)調(diào)整位移系數(shù)λ來(lái)自由控制探索速度。無(wú)論是緩慢的漫步還是快速的移動(dòng),RELIC都能保持高質(zhì)量和時(shí)間穩(wěn)定的輸出。這就像一輛能夠在各種速度下都保持平穩(wěn)行駛的高級(jí)轎車。

      多鍵控制功能讓用戶體驗(yàn)更加豐富和直觀。RELIC能夠可靠地響應(yīng)復(fù)合操作,比如在前進(jìn)的同時(shí)轉(zhuǎn)頭觀察,或者在側(cè)移的過(guò)程中調(diào)整視角高度。這種復(fù)合動(dòng)作控制為用戶提供了高度的運(yùn)動(dòng)自由度,使虛擬世界探索變得更加自然和流暢。

      長(zhǎng)期記憶能力可能是RELIC最令人印象深刻的特色。即使在大幅度的相機(jī)運(yùn)動(dòng)之后,系統(tǒng)仍能準(zhǔn)確恢復(fù)之前生成的場(chǎng)景內(nèi)容,細(xì)節(jié)損失極小。這種能力在對(duì)比實(shí)驗(yàn)中表現(xiàn)得尤為明顯:當(dāng)相機(jī)離開(kāi)某個(gè)區(qū)域后再次返回時(shí),其他系統(tǒng)往往會(huì)生成完全不同的內(nèi)容,而RELIC能夠忠實(shí)地重現(xiàn)之前的場(chǎng)景,包括物體的位置、紋理和光照等細(xì)節(jié)。

      九、技術(shù)局限與未來(lái)展望

      盡管RELIC取得了突破性進(jìn)展,但研究團(tuán)隊(duì)也誠(chéng)實(shí)地指出了當(dāng)前系統(tǒng)的一些局限性。這些局限性主要源于訓(xùn)練數(shù)據(jù)的特性和計(jì)算資源的約束,就像一個(gè)剛剛畢業(yè)的學(xué)生,雖然掌握了扎實(shí)的基礎(chǔ)知識(shí),但在某些專業(yè)領(lǐng)域還需要進(jìn)一步的學(xué)習(xí)和實(shí)踐。

      首先是場(chǎng)景動(dòng)態(tài)性的限制。由于RELIC主要在靜態(tài)場(chǎng)景渲染的數(shù)據(jù)上訓(xùn)練,生成的視頻在場(chǎng)景動(dòng)態(tài)性和多樣性方面仍有改進(jìn)空間。現(xiàn)在的RELIC就像一個(gè)專門拍攝風(fēng)景照的攝影師,雖然能夠完美捕捉自然風(fēng)光,但在拍攝運(yùn)動(dòng)場(chǎng)面或人物活動(dòng)時(shí)還不夠熟練。這個(gè)問(wèn)題可以通過(guò)擴(kuò)展訓(xùn)練數(shù)據(jù)集來(lái)逐步改善,加入更多動(dòng)態(tài)場(chǎng)景和互動(dòng)元素。

      生成時(shí)長(zhǎng)的擴(kuò)展是另一個(gè)挑戰(zhàn)。雖然RELIC已經(jīng)能夠生成20秒的高質(zhì)量視頻,但距離真正的"無(wú)限探索"還有一段距離。要實(shí)現(xiàn)分鐘級(jí)別的連續(xù)生成,需要進(jìn)一步優(yōu)化內(nèi)存管理和長(zhǎng)期一致性保持機(jī)制。這就像馬拉松運(yùn)動(dòng)員需要專門的耐力訓(xùn)練才能跑完全程一樣。

      計(jì)算資源需求是當(dāng)前最實(shí)際的限制。RELIC需要大型模型(14B參數(shù))、KV緩存用于長(zhǎng)期記憶,以及多次迭代的去噪步驟,這些都對(duì)硬件提出了較高要求。在資源受限的環(huán)境下,推理延遲會(huì)顯著增加。不過(guò),隨著硬件技術(shù)的快速發(fā)展和優(yōu)化算法的不斷改進(jìn),這個(gè)問(wèn)題有望在不久的將來(lái)得到緩解。

      盡管存在這些局限性,RELIC為交互式視頻世界建模領(lǐng)域奠定了堅(jiān)實(shí)的基礎(chǔ)。研究團(tuán)隊(duì)相信,通過(guò)有針對(duì)性的改進(jìn),包括數(shù)據(jù)集的擴(kuò)充、訓(xùn)練策略的優(yōu)化,以及硬件資源的合理配置,這些問(wèn)題都是可以解決的。更重要的是,RELIC展示的技術(shù)路徑是可行和可擴(kuò)展的,為未來(lái)更高級(jí)的世界模擬器提供了明確的發(fā)展方向。

      RELIC的出現(xiàn)標(biāo)志著我們向真正的交互式虛擬世界邁出了重要一步。雖然現(xiàn)在還不能完全替代傳統(tǒng)的游戲開(kāi)發(fā)或視頻制作,但它開(kāi)辟了一個(gè)全新的可能性空間。未來(lái),我們可能會(huì)看到這項(xiàng)技術(shù)在教育培訓(xùn)、娛樂(lè)體驗(yàn)、設(shè)計(jì)預(yù)覽、甚至是虛擬旅游等領(lǐng)域發(fā)揮重要作用。當(dāng)技術(shù)進(jìn)一步成熟時(shí),每個(gè)人都可能擁有創(chuàng)造和探索個(gè)人專屬虛擬世界的能力,這將徹底改變我們與數(shù)字內(nèi)容交互的方式。

      Q&A

      Q1:RELIC和傳統(tǒng)視頻游戲引擎有什么區(qū)別?

      A:傳統(tǒng)游戲引擎需要開(kāi)發(fā)者預(yù)先構(gòu)建所有3D模型和場(chǎng)景,而RELIC只需要一張圖片就能生成可探索的世界。它就像一個(gè)魔法畫師,能把靜態(tài)圖片變成可以自由行走的三維空間,而且還能"記住"你去過(guò)的地方,確保再次返回時(shí)景象保持一致。

      Q2:RELIC生成的視頻世界能保持多長(zhǎng)時(shí)間的記憶?

      A:RELIC目前能維持20秒時(shí)長(zhǎng)的連續(xù)記憶,這意味著你可以在虛擬世界中探索20秒,然后返回最初位置時(shí)仍能看到與開(kāi)始時(shí)完全一致的景象。雖然20秒聽(tīng)起來(lái)不長(zhǎng),但這已經(jīng)是這類AI技術(shù)的重大突破,因?yàn)榇蠖鄶?shù)同類系統(tǒng)只能維持幾秒鐘的一致性。

      Q3:普通用戶現(xiàn)在能使用RELIC技術(shù)嗎?

      A:目前RELIC還是研究階段的技術(shù),需要專業(yè)的GPU設(shè)備才能運(yùn)行。研究團(tuán)隊(duì)使用4張H100 GPU才能實(shí)現(xiàn)16幀每秒的實(shí)時(shí)生成。不過(guò)隨著硬件技術(shù)發(fā)展和算法優(yōu)化,未來(lái)這項(xiàng)技術(shù)有望普及到消費(fèi)級(jí)設(shè)備上,讓普通用戶也能體驗(yàn)從照片創(chuàng)建虛擬世界的神奇功能。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      “新疆棉”事件5年后,那個(gè)丑態(tài)百出的“反華妖女”,如今怎樣了

      “新疆棉”事件5年后,那個(gè)丑態(tài)百出的“反華妖女”,如今怎樣了

      博覽歷史
      2025-09-10 20:25:07
      不同品牌奧司他韋售價(jià)差70倍

      不同品牌奧司他韋售價(jià)差70倍

      大象新聞
      2025-12-12 21:57:01
      香港神秘男子花600萬(wàn)港幣求購(gòu)5套大埔火災(zāi)房,稱不在乎破壞程度及死亡事件!港府:災(zāi)前入住才能獲補(bǔ)助和安置

      香港神秘男子花600萬(wàn)港幣求購(gòu)5套大埔火災(zāi)房,稱不在乎破壞程度及死亡事件!港府:災(zāi)前入住才能獲補(bǔ)助和安置

      澳門月刊
      2025-12-12 09:28:45
      五月天經(jīng)紀(jì)人8字回懟朱孝天,狠狠替F4出了口惡氣,大S沒(méi)說(shuō)謊

      五月天經(jīng)紀(jì)人8字回懟朱孝天,狠狠替F4出了口惡氣,大S沒(méi)說(shuō)謊

      老范談史
      2025-12-10 19:22:28
      2026養(yǎng)老金調(diào)整信號(hào)落地,不按工齡漲么,答案在這幾個(gè)關(guān)鍵信號(hào)里

      2026養(yǎng)老金調(diào)整信號(hào)落地,不按工齡漲么,答案在這幾個(gè)關(guān)鍵信號(hào)里

      陳博世財(cái)經(jīng)
      2025-12-12 14:21:46
      增設(shè)兩個(gè)車站,佛穗莞城際鐵路新進(jìn)展

      增設(shè)兩個(gè)車站,佛穗莞城際鐵路新進(jìn)展

      南方都市報(bào)
      2025-12-09 11:22:08
      中國(guó)首例五胞胎終于長(zhǎng)大了,父親因勞累去世,母親直言后悔生下他們

      中國(guó)首例五胞胎終于長(zhǎng)大了,父親因勞累去世,母親直言后悔生下他們

      等風(fēng)來(lái)育兒聯(lián)盟
      2025-08-01 12:21:35
      全紅嬋擔(dān)心的事還是發(fā)生,老家別墅剛封頂,爸媽就走上大衣哥老路

      全紅嬋擔(dān)心的事還是發(fā)生,老家別墅剛封頂,爸媽就走上大衣哥老路

      以茶帶書
      2025-11-21 12:08:09
      WTT總決賽12月13日賽程緊湊!混雙半決賽+決賽!女單半決賽開(kāi)打

      WTT總決賽12月13日賽程緊湊!混雙半決賽+決賽!女單半決賽開(kāi)打

      郝小小看體育
      2025-12-13 05:21:07
      放棄中國(guó)國(guó)籍投靠日本,結(jié)果日本不收中國(guó)不要,成為夾縫中的黑戶

      放棄中國(guó)國(guó)籍投靠日本,結(jié)果日本不收中國(guó)不要,成為夾縫中的黑戶

      牛牛叨史
      2025-12-13 02:23:07
      樊振東與小朱大夢(mèng)的友情,真摯而暖心

      樊振東與小朱大夢(mèng)的友情,真摯而暖心

      眼界看視野
      2025-12-12 20:58:53
      西甲變天:姆巴佩重返世界第1 皇馬妖星暴漲3000萬(wàn) 貝林跌至1.6億

      西甲變天:姆巴佩重返世界第1 皇馬妖星暴漲3000萬(wàn) 貝林跌至1.6億

      風(fēng)過(guò)鄉(xiāng)
      2025-12-12 20:54:43
      曼聯(lián)冬窗簽中場(chǎng)計(jì)劃曝光,或嘗試壓哨租加拉格爾!三大首選皆沒(méi)戲

      曼聯(lián)冬窗簽中場(chǎng)計(jì)劃曝光,或嘗試壓哨租加拉格爾!三大首選皆沒(méi)戲

      羅米的曼聯(lián)博客
      2025-12-13 11:02:12
      “我剛收到莫斯科的消息……”武契奇與馮德萊恩低語(yǔ)被意外錄下,后者打斷談話

      “我剛收到莫斯科的消息……”武契奇與馮德萊恩低語(yǔ)被意外錄下,后者打斷談話

      環(huán)球網(wǎng)資訊
      2025-12-12 10:54:53
      女孩曬出已故父親合影,沒(méi)想到卻是網(wǎng)友先繃不住了:這不是……

      女孩曬出已故父親合影,沒(méi)想到卻是網(wǎng)友先繃不住了:這不是……

      譚老師地理大課堂
      2025-12-11 22:20:25
      一年兩次分紅股息率5%,股價(jià)從94元跌到35元,市盈率僅7倍

      一年兩次分紅股息率5%,股價(jià)從94元跌到35元,市盈率僅7倍

      投資觀
      2025-12-13 07:10:03
      外賣時(shí)代將被終結(jié)?一個(gè)全新行業(yè)正悄悄取代外賣,你準(zhǔn)備好了嗎?

      外賣時(shí)代將被終結(jié)?一個(gè)全新行業(yè)正悄悄取代外賣,你準(zhǔn)備好了嗎?

      貓叔東山再起
      2025-12-10 10:05:04
      在國(guó)安局維修電臺(tái)18年,退役前夜發(fā)現(xiàn)一臺(tái)廢機(jī)有神秘信號(hào)!

      在國(guó)安局維修電臺(tái)18年,退役前夜發(fā)現(xiàn)一臺(tái)廢機(jī)有神秘信號(hào)!

      千秋文化
      2025-12-08 10:53:53
      說(shuō)說(shuō)大V九邊為何如此感嘆“《芳華》又火了”

      說(shuō)說(shuō)大V九邊為何如此感嘆“《芳華》又火了”

      人格志
      2025-12-06 00:06:19
      每天這樣跪趴10分鐘,內(nèi)分泌正常了,肩頸腰背都不痛了!

      每天這樣跪趴10分鐘,內(nèi)分泌正常了,肩頸腰背都不痛了!

      瑜伽解剖學(xué)
      2025-11-26 16:19:27
      2025-12-13 12:04:49
      科技行者 incentive-icons
      科技行者
      科技正在如何變革商業(yè)世界
      6531文章數(shù) 542關(guān)注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態(tài)

      頭條要聞

      央媒談美新國(guó)安報(bào)告:時(shí)隔8年 美國(guó)提到中國(guó)的語(yǔ)氣變了

      頭條要聞

      央媒談美新國(guó)安報(bào)告:時(shí)隔8年 美國(guó)提到中國(guó)的語(yǔ)氣變了

      體育要聞

      有了風(fēng)騷白人禿頭,忘掉談了10年的前任

      娛樂(lè)要聞

      保劍鋒方回應(yīng)爭(zhēng)議,否認(rèn)出軌贈(zèng)送香水

      財(cái)經(jīng)要聞

      鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

      汽車要聞

      表面風(fēng)平浪靜 內(nèi)里翻天覆地!試駕銀河星艦7 EM-i

      態(tài)度原創(chuàng)

      數(shù)碼
      旅游
      藝術(shù)
      家居
      公開(kāi)課

      數(shù)碼要聞

      華碩預(yù)熱新一代Zenbook DUO雙屏本,雙電池設(shè)計(jì)將亮相CES 2026

      旅游要聞

      震撼!4000米海拔看日出云海金光萬(wàn)丈

      藝術(shù)要聞

      砸50億!從網(wǎng)紅小城到摩天地標(biāo)!230米淄博第一高樓

      家居要聞

      溫潤(rùn)質(zhì)感 打造干凈空間

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 东京热无码国产精品| 波多野结衣一区二区三区av免费| 摸丰满大乳奶水www免费| 野花社区视频在线观看| L日韩欧美看国产日韩欧美| H无码| 欧美1区2区3区| 美女Av影院| 美女黄频视频大全免费的国内| 国产av普通话对白国语| 亚洲AVAV天堂Av在线播放| 苏州市| 欧洲精品码一区二区三区| 性荡视频播放在线视频| 正在播放肥臀熟妇在线视频| www.婷婷| 中文字幕精品无亚洲字幕| 亚洲男人最新版本天堂| 亚洲老熟女一区二区三区| 欧亚AV| AV在线资源| 欧美最猛性xxxxx大叫| 色综合久久中文综合久久激情 | 国产 精品 自在 线免费| 免费福利视频一区二区三区高清| 亚洲图片在线| 普宁市| 精品国产污污免费网站| 亚洲成人视频| 国产精品18禁久久久久久白浆| 克什克腾旗| 久久久综合香蕉尹人综合网| 无码av最新无码av专区| 91精品人妻一区二区三区蜜桃| 亚洲欧美首页| 奇米影视7777狠狠狠狠色| 无套內谢波多野结衣| 91视频网亚瑟视频| 天堂一区| 少妇愉情理伦片高潮日本| 一道本AV免费不卡播放|