谷歌在去年夏天發(fā)布了一個(gè)世界模型 Genie 3。
支持實(shí)時(shí)生成 24 幀 720P 可以可以交互的視頻內(nèi)容。
而且還可以保持超過幾分鐘的一致性。
演示視頻真的很頂,但是由于成本太高一直沒有開放使用。
剛剛,谷歌宣布美國 18 歲以上的 Ultra 用戶可以直接嘗試 Genie 3。
藏師傅趕緊去試了一下,趁著人少。
結(jié)果我去,太牛批了!
我感覺今年一定是 AI 互動(dòng)游戲和互動(dòng)視頻的大年!
簡單總結(jié)一下 Genie 3 的特點(diǎn):
- 操控延遲非常低
- 可以控制角色的方向和鏡頭的方向。
- 畫面清晰度相當(dāng)可以用
- 角色跟環(huán)境的物理交互相當(dāng)真實(shí)。
- 可以持續(xù)操控角色超一分鐘
口說無憑,我們來看看藏師傅跑的一些測試。
首先我自己創(chuàng)建了一個(gè)史前森林世界,角色我選了一個(gè)恐龍。
它會(huì)先生成一張首幀圖片,你確定沒問題了就可以開始生成世界。
可以看到我在本身連接美國服務(wù)延遲很高的情況下,這個(gè)視角控制和角色運(yùn)動(dòng)控制都非常跟手。
差不多跟頂著高延遲玩美服游戲差不多。
而且恐龍運(yùn)動(dòng)非常順滑和符合生物特征,角色一致性保持的很好,幾乎沒有變化。
我故意進(jìn)行了一些大幅運(yùn)動(dòng),環(huán)境一致性也沒問題,沒有突然變化和抽搐。
這時(shí)候我發(fā)現(xiàn)不對(duì)了,這東西好像真他媽的很牛批!
然后我從他預(yù)設(shè)的世界選擇了一個(gè)毛氈風(fēng)格的蝸牛世界。
Remix 了一下,我把蝸牛的藍(lán)殼改成了紅殼。
然后我發(fā)現(xiàn)他的提示里面寫了可以跳,這次重點(diǎn)試一下這個(gè)。
首先可以看到他的風(fēng)格化一致性保持的也非常好,一直保持了毛氈的變化。
然后就是在我習(xí)慣了延遲和操控后,蝸牛變得跟手了很多。
我試了一次果然可以跳,而且蝸牛每次跳的高度都一致,有沒有發(fā)生陷到地里的情況。
這時(shí)候物理表現(xiàn)已經(jīng)初見端倪。
之后發(fā)現(xiàn)沒有蝸牛走到石頭的部分就被擋住了,走不動(dòng)。
后面我就開始頻繁的跳躍,你甚至可以跳上臺(tái)階再跳下來。
而且在我一直瞎跳和轉(zhuǎn)視角的過程中之前的世界場景一直保持穩(wěn)定,太牛了。
最后我想說,這次更加極限的測試一下他的物理表現(xiàn)。
我創(chuàng)建了一個(gè)伊斯坦布爾的優(yōu)化版本,還有一只貍花貓。
這個(gè)時(shí)候我已經(jīng)習(xí)慣了這個(gè)延遲,能夠完全可以非常自如地操縱它。
我上來就開始不走尋常路:我根本不走那條路,而是直接往路邊的箱子上跳。
結(jié)果我發(fā)現(xiàn),它真的能模擬貓的跳躍形態(tài),而不是簡單地四肢僵硬、像僵尸一樣亂蹦。
它是真的像貓?jiān)谔S一樣,會(huì)先伸腿。
然后它非常簡單地跳上了路邊的箱子。我甚至能從這個(gè)箱子跳到另一個(gè)箱子!
這太牛逼了,朋友們!尤其是你玩過 AI 視頻的話。
視頻模型甚至有時(shí)候都不能保證這個(gè)不陷下去,更別說以前的游戲穿模是非常常見的事,在這兒不成問題。
然后我就不斷地在跳路邊的箱子和拱路邊的行人。
我發(fā)現(xiàn)沒有穿模的情況,它都能做出符合貓咪運(yùn)動(dòng)的動(dòng)作,并且跟路邊的墻和箱子有碰撞。
然后,在玩了三個(gè)世界以后,我就沒有辦法正常地生成世界了(估計(jì)大家都反應(yīng)過來,跑進(jìn)來玩了)。
這個(gè)就是我目前的三個(gè)測試。
真的,我玩了以后發(fā)現(xiàn):新時(shí)代到了,朋友們!
簡單介紹一下它的操作流程:
首先進(jìn)去以后,你會(huì)看到很多個(gè)由“泡泡”組成的各種預(yù)制世界。
你點(diǎn)進(jìn)去的話可以 remix 它,也就是把那個(gè)世界中的某些元素改掉。你可以改風(fēng)格,可以改世界的內(nèi)容,也可以改這個(gè)角色的內(nèi)容。
Remix 的時(shí)候,你就直接像用 Lana 改圖一樣,輸入你想改的提示詞就可以了。
改完以后:先點(diǎn)擊“創(chuàng)建世界”左邊那個(gè)按鈕把圖片改掉,然后再點(diǎn)擊“創(chuàng)建世界”
![]()
最中間就是一個(gè)創(chuàng)建按鈕,你可以通過這個(gè)按鈕完全從頭去創(chuàng)建世界。
你需要填寫的話,分為以下幾個(gè)部分:
- 1.左邊:填寫世界的提示詞(描述這個(gè)世界是什么樣的)
- 2.右邊:填寫角色的提示詞(描述這個(gè)角色長什么樣)
- 3.左邊補(bǔ)充:你還可以寫風(fēng)格提示詞(比如各種毛氈風(fēng)格之類的)
- 4.下方:可以上傳你生成的其他圖片,甚至把你自己上傳上去
- 5.模式選擇:可以選擇切換第一人稱視角還是第三人稱視角
這個(gè)我試了一下,視角切換有時(shí)候并不生效
![]()
進(jìn)入游戲后,操作方式如下:
- 1.WASD:控制角色的移動(dòng)方向
- 2.右側(cè)箭頭:控制鏡頭的方向(這與常見的3D游戲操作類似)
- 3.此外,角色還可以進(jìn)行跳躍操作。
![]()
我感覺美國的朋友玩這個(gè),如果延遲低的話會(huì)更爽。
720P已經(jīng)完全可玩了,我們真的到了一個(gè)新的時(shí)代。
想象一下!
可以通過大語言模型去構(gòu)建世界,構(gòu)建NPC,加入各種隨機(jī)事件,再加上一些音頻。
你可以想去哪兒就去哪兒, 每個(gè)人都能構(gòu)建自己想要的游戲世界和劇情。
像前段時(shí)間在 Steam 上爆火的那些 3D 真人影視游戲,現(xiàn)在看來是非常的觸手可及,人人都可以做。
這個(gè)東西的想象力太大了,希望今年年底成本可以降一降,時(shí)間可以再長點(diǎn)。
Gemini 3 改變世界(即加入隨機(jī)事件并影響世界的能力),這次由于算力問題沒有加進(jìn)來。希望谷歌能在后面更新一下。
如果你是 Ultra 用戶的話,你可以在這里嘗試(labs.google/fx/projectgenie)。
但是希望谷歌的服務(wù)器能給力點(diǎn),現(xiàn)在根本沒辦法正常生成。
好了,這就是藏師傅給大家?guī)淼腉enie 3首測。
如果覺得對(duì)你有幫助的話,歡迎幫我點(diǎn)個(gè)贊,或者轉(zhuǎn)發(fā)給你需要的朋友!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.