![]()
大數(shù)據(jù)文摘出品
昨天,Google Deepmind推出新一代AI系統(tǒng)Genie 3,能夠根據(jù)簡單文本生成實時互動的3D虛擬世界。這一模型不僅能構(gòu)建世界,還能讓用戶以每秒24幀、720p分辨率的畫質(zhì)在其中自由探索。
與傳統(tǒng)視頻生成不同,Genie 3采用自回歸方式逐幀生成畫面,每一幀都會參考多達(dá)一分鐘內(nèi)的環(huán)境細(xì)節(jié)。
這種方法顯著提升了視覺連續(xù)性,生成的世界在交互過程中能夠在數(shù)分鐘內(nèi)保持物理和視覺一致性。
Deepmind表示,這是首個同時實現(xiàn)實時交互與物理連續(xù)性的AI世界模型,為發(fā)展通用人工智能(AGI)打下了基礎(chǔ)。
Genie 3是繼Genie 1、Genie 2,以及視頻生成器Veo系列之后的又一重要進(jìn)展。
Deepmind希望將其發(fā)展為“基礎(chǔ)世界模型”(Foundation World Model),為更高級的智能體系統(tǒng)提供訓(xùn)練平臺。
01 AI世界的可塑性與開放性
用戶僅需輸入文字提示,就能在Genie 3中生成如“火山噴發(fā)”“飛行島嶼”或“史前遺跡”等復(fù)雜場景。
這些提示不僅能改變場景天氣、召喚新物體,還能制造各種“反事實情境”,測試AI智能體在突發(fā)情況下的反應(yīng)。
在一個演示中,鏡頭從多個角度移動,畫面左側(cè)的樹木在0:00、0:20和0:40秒的時間節(jié)點始終如一,清晰展現(xiàn)出環(huán)境的穩(wěn)定性。
Genie 3的獨(dú)特之處在于,它無需任何預(yù)設(shè)3D模型或數(shù)據(jù),只需文字描述即可構(gòu)建出穩(wěn)定世界。
這與NeRF或Gaussian Splatting等依賴已有數(shù)據(jù)的技術(shù)不同,意味著它可以構(gòu)建更開放、動態(tài)的訓(xùn)練環(huán)境。
Deepmind的SIM智能體(SIMA)已經(jīng)在這些虛擬世界中進(jìn)行測試,系統(tǒng)對智能體的目標(biāo)一無所知,僅對其動作做出反應(yīng)。
這種設(shè)置讓研究人員能夠更真實地模擬AI執(zhí)行復(fù)雜任務(wù)的過程,并探索其潛在弱點。
02 從AI研究到游戲引擎的未來
Deepmind稱Genie 3目前處于有限研究預(yù)覽階段,僅向部分研究人員和創(chuàng)作者開放。
這一做法旨在提前識別風(fēng)險,為后續(xù)發(fā)展提供參考。
盡管Genie 3還有一些技術(shù)限制,例如交互時長有限、多智能體互動尚不成熟、現(xiàn)實地理位置無法定位等,但它已展示出巨大的潛力。
未來,這一模型可用于教育、模擬訓(xùn)練、專家決策支持等領(lǐng)域,尤其適合復(fù)雜情境下的預(yù)演和演練。
Deepmind CEO Demis Hassabis曾表示,世界模型是實現(xiàn)AGI的關(guān)鍵,因為它們能讓AI在無限多樣的模擬環(huán)境中自主學(xué)習(xí)。
這一理念也得到AI研究者Richard Sutton和David Silver的支持,他們認(rèn)為AI的未來應(yīng)從靜態(tài)數(shù)據(jù)轉(zhuǎn)向基于自身經(jīng)驗的學(xué)習(xí)過程。
而Genie 3,正是這一理念的具象體現(xiàn)。
NVIDIA AI總監(jiān)Jim Fan認(rèn)為,Genie 3代表著“游戲引擎2.0”的雛形。
他預(yù)測,未來的游戲開發(fā)將不再依賴復(fù)雜的3D素材與場景圖,而由數(shù)據(jù)驅(qū)動的AI模型直接生成可交互空間。
開發(fā)者只需通過提示語進(jìn)行操作,無需理解圖形學(xué)、著色器或場景管理等技術(shù)細(xì)節(jié)。
“這將是游戲開發(fā)的終局(The End Game),”Jim Fan寫道,“全部由提示工程驅(qū)動,一切由數(shù)據(jù)決定,復(fù)雜性交由AI處理。”
正如語言模型改變了寫作方式,Genie 3有望改變游戲的開發(fā)方式,乃至整個虛擬世界的創(chuàng)造范式。
Genie 3不僅是一個AI模型,它是Deepmind對未來世界的實驗室。
通過它,我們看見了一種可能:人類以語言建造世界,AI在世界中學(xué)習(xí)行為。
作者長期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動態(tài)與技術(shù)趨勢!
GPU 訓(xùn)練特惠!
H100/H200 GPU算力按秒計費(fèi),平均節(jié)省開支30%以上!
掃碼了解詳情?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.