左下角的血條、右下角的小地圖,還有這一連串絲滑的跑酷動作……

視頻來源:X@awesome_visuals
看到這個畫面,你是不是以為《瘋狂動物城2》這邊剛拿下中國影史進口動畫片票房第一,那邊就趁勢要推出 3A 開放世界游戲了?甚至這光影和物理碰撞,比很多大廠的游戲都要真實。
但這其實是一段 100% 由 AI 生成的視頻。就在這幾天,這段視頻在國外社交媒體創下1500 萬瀏覽量紀錄。
![]()
截至 12 月 5 日下午 4 點 18 分,《瘋狂動物城2》累計票房 23.04 億元,已成為中國影史進口動畫片票房第一
評論區的網友都在說,這簡直不敢相信,如果這個視頻演示是可交互的,一種的全新的游戲類型可能馬上就要誕生了;還有人說,哪是新的游戲,我們看的電視劇,也不過如此了。
視頻創作者在介紹里面提到,這段 10s 的視頻是由Nano Banana Pro、可靈以及圖片視頻強化 AI 工具 Topaz 來完成的。

這名博主很快又更新了另一個視頻,馴龍高手,同樣是用 Nano Banana Pro 和可靈等 AI 工具來制作。今年六月,真人版馴龍高手上映,雖然沒有動畫版評分高,但也收獲了一大波好評。現在這個 AI 游戲版,畫面設計和審美,網友表示馬馬虎虎,也能買單。
有人問博主,這些視頻都是怎么做的;她回了一句,就是先用 Nano Banana Pro 生成你想呈現的畫面,接下來就是不斷的嘗試。
![]()
這個教程也太樸素了,能不能直接給我一套提示詞,讓我也去試試,是不是 AI 模型真的有這么厲害了。
快手的視頻生成模型可靈,在這周一連五天,更新了 O1、2.6 等多款音視頻圖片模型。社交媒體上用可靈生成的 AI 視頻,確實一個比一個真實。
無論是物理世界的運動規律,還是各種復雜的鏡頭語言,整體質感和過去,可能兩三個月之前,又完全不是一個級別。
我們也用 Nano Banana Pro 和 AI 視頻工具可靈、Google Veo 3.1、Sora 2 Pro 等,嘗試了多個有意思的玩法,還提供了詳細的提示詞。
瘋狂動物城的游戲系列,不能只有大世界
讓 Judy 一個人在游戲里面奔跑多寂寞,我們直接上傳自己的照片,然后拉上 Nick,一起在游戲里面沖刺。

雖然文字效果,除了來自 Nano Banana Pro 的首幀,剩下的片段就崩掉了,但是視頻動效真的很強。
我們先用一張真實人物的照片,丟給 Nano Banana Pro,讓它給我們生成一張首幀圖。
提示詞:一張開放世界游戲截圖,背景設定在迪士尼的《瘋狂動物城》。 使用提供的真人照片作為主要可玩角色,但將此人轉換為《瘋狂動物城》風格的3D動畫角色。將參考圖片中的朱迪和尼克放在真人的左右兩邊,兩者均以全3D動畫電影風格呈現,與其參考姿勢完美一致。場景是一個明亮白天的《瘋狂動物城》城市街道:高聳彎曲的大樓、多彩店面,以及許多擬人化動物 NPC 在背景中行走互動。
添加完整開放世界游戲 HUD 界面: 左下角:玩家頭像(基于真人臉部)及耐力條; 右上角:顯示周圍街道的小型圓形地圖; 頂部中央:任務文字:「與朱迪和尼克會合 → 12米」; 右側:三個帶冷卻環的技能圖標; 底部中央:「按E鍵交互」。16:9 大小,4K 畫質。
![]()
得到首幀圖之后,使用可靈的首尾幀視頻生成就能得到最后的視頻。不過,和 Nano Banana Pro 對提示詞寬松的要求不同,大部分的視頻生成模型,還是需要我們給出詳細的指令,不然大概率又是一場抽卡游戲。
提示詞:在迪士尼《瘋狂動物城》的世界中,從包含真人玩家、朱迪、尼克以及完整游戲HUD的提供截圖開始,連續10秒開放世界游戲風格追逐場景。保留所有面部特征、比例、服裝以及參考畫面中的3D動畫電影渲染風格。動作開始時,真人玩家角色突然沿著《瘋狂動物城》街道向前沖刺,自然的奔跑動畫和強烈的前進動態。
攝像機從稍微靠后且居高的位置以動態第三人稱視角緊密跟隨,具有平滑的游戲式擺動但無過度晃動。朱迪在玩家左側奔跑,尼克在右側,兩人加速進入快速追逐。他們的動作充滿活力:耳朵彈跳,尾巴飄動,制服隨著運動而反應,雙腿用力蹬地。當三名角色飛速穿過時,《瘋狂動物城》環境中的NPC動物紛紛讓路。
水果攤搖晃,招牌顫抖,可以看到城市深度和規模。當他們轉彎或加速時攝像機可能略微偏移或傾斜,但始終保持連續、流暢并向前移動,使速度感和動力感強烈。光照、陰影及紋理必須完全與《瘋狂動物城》動畫電影外觀一致。
保持所有HUD元素完美穩定并鎖定屏幕空間:左下角:玩家頭像(來自截圖)伴隨體力條因沖刺而減少;右上角:圓形小地圖根據移動方向輕微更新;頂部中央:任務文字「與朱迪和尼克會合 → 12米」,只是讓數字 12 不斷下降到 0;整個10秒必須感覺像真實、生動的開放世界游戲錄制:玩家、朱迪和尼克高速穿越擁擠的《瘋狂動物城》街道,以生動動畫電影質量呈現,并展現強烈前進動態感。
除了大世界,我們還用 Nano Banana Pro 生成了多個不同游戲的截圖。像是下面的跑跑卡丁車、街頭霸王的格斗游戲、馬里奧風格的跳躍游戲、還有 Limbo 類的推箱子解謎游戲。
![]()
不得不說,Nano Banana Pro 真的很強大,生成這些游戲截圖的提示詞雖然都比較長,但是我試過,即便精簡掉很多內容,出來的效果也是差別很小。
可以參考的提示詞方案:一個高度詳細的開放世界卡丁車競速AAA游戲截圖,設定在迪士尼的《瘋狂動物城》中。使用提供的真人照片作為主要可玩角色,將該人物轉換為《瘋狂動物城》風格的3D動畫角色,同時完全保留面部特征。將人類玩家置于畫面中心前景,坐在一輛風格化賽車中。朱迪坐在她自己的藍色警察主題賽車中,稍微靠后并位于左側; 尼克坐在綠色狐貍主題賽車中,稍微靠后并位于右側。
所有角色應與其參考圖像完全一致,并保持《瘋狂動物城》的3D動畫電影比例、陰影和材質。場景是一個明亮多彩的《瘋狂動物城》賽道:彎曲道路、生動的動物主題建筑、歡呼的人形動物NPC觀眾、旗幟、橫幅、賽道邊界。添加常見的賽車競速游戲HUD疊加層,16:9, 4K.
這些游戲的風格特別像平時刷國外的社交媒體,在推薦流里面冒出來的廣告,色彩鮮艷、內容緊湊,然后還有幾行字,提醒你說「不用下載,點開就能玩」。

在生成的視頻里,賽道上沒有多出來額外的東西,所有的賽車也一直保持在可追蹤的位置,而且提示詞只有六個字,「賽車比賽開始」;不過我相信這是手氣好的結果。
提示詞:一個連續10秒的一鏡到底電影化卡丁車競速游戲場景,設定在迪士尼的《瘋狂動物城》中,從提供的起跑線截圖開始。保持玩家、朱迪、尼克、他們的卡丁車、揮旗裁判以及整個HUD完全一致。
視頻開始時,裁判揮動巨大的方格旗向下啟動比賽。三輛卡丁車瞬間加速并避開裁判——攝像機干凈利落地從裁判旁邊掠過,同時卡丁車向前沖出。攝像機以緊湊的第三人稱追逐角度跟隨玩家的卡丁車,伴隨著強烈的引擎震動、輪胎旋轉和爆發式前進動作,帶來強烈加速感。
當卡丁車在直路上提速時,攝像機進行動態AAA風格賽車運動:— 稍微拉高形成漂移跟拍鏡頭,— 然后繞到玩家卡丁車正面,以戲劇性的反向特寫展示玩家、朱迪和尼克奮力沖刺,— 接著旋轉至平滑高空俯視鏡頭,從上方跟蹤三輛并排競速中的卡丁車。
隨后攝像機再次下降靠近道路,以低矮快速側滑追蹤鏡頭捕捉畫面:輪胎貼近鏡頭飛馳而過,護欄擦出的火花四濺,同時朱迪嘗試超越對手。接下來攝像機切換為身臨其境的第一人稱駕駛艙視角:高速前進,道路震動,風聲扭曲,以及世界在眼前延展。玩家稍微傾斜身體精準躲避小型障礙物,然后完美右側超越尼克的卡丁車完成一次絕佳操作。
所有角色必須與參考圖片及《瘋狂動物城》動畫電影視覺風格完全一致。動作需具備真實物理驅動力:方向盤晃動、車輛傾斜、輪胎尖叫,引擎轟鳴。HUD始終屏幕鎖定且完美呈現:右下角:速度表迅速攀升超過120公里/小時;左上角:玩家頭像更新位置「2nd / 8」 → 「1st / 8」,顯示超越后的排名;頂部中間:「GO!」倒計時文字自動變化然后消失;右上角:圓形小地圖根據方向略有更新;底部中間:「按住空格鍵加速」短暫閃爍提示。
整個10秒必須呈現如同AAA級別質量的視頻化《瘋狂動物城》內賽車游戲片段,包括復雜相機編排、不間斷動作流暢性。
如果抽到不好的結果,我們只需要在新的提示詞里面添加一個 Negative Prompt,負向提示詞,意思是模型不可以做的事情。
例如在這個卡丁車游戲里面,賽車經常會沖出跑道,以及扭曲的車輪或者人物,甚至是突然多出來的一輛賽車、掉轉車頭去新的賽道,這些都可以放在負向提示詞里面。
其他的幾種游戲,我們也生成了一些視頻片段。


疑犯追蹤,刺激感拉滿
除了瘋狂動物城,最近 Nano Banana Pro 又多了很多新玩法,像這個疑犯追蹤里面的截圖。我們只用上傳一張照片,就可以得到同款的視頻監控大頭貼。
![]()
提示詞:使用上傳的圖像作為源,創建一個高角度的 CCTV 監控鏡頭。檢測圖像中的主要可見人物,并自動繪制一個白色矩形框圍繞每個面部。對于突出的人物,添加一個大的縮放內嵌框:一個銳利、增強的特寫鏡頭,顯示在連接著細白線的浮動矩形框架中。保持主圖像稍微噪點和安全攝像頭(軟粒度、輕微失真、顏色暗淡),而縮放內嵌框應該更清晰、更明亮、更詳細。 沒有文本,沒有時間戳,只有盒子和連接線的疊加。保持上傳圖像的原始場景布局、角度和環境。
我們用這個提示詞,也嘗試了幾張圖片,效果都很不錯。
![]()
而如果想要讓它像電影一樣,會隨著人物角色的移動,這個候選框也能自動跟隨,甚至會顯示出他的個人信息,現在的 AI 視頻也有能力做到了。
不過我們在問 Gemini 如何才能做到這種效果時,Gemini 給的答案是,現在的 AI 做不了;他還很詳細地給了我完整的理由。
你目前遇到的問題,白框不跟隨移動、或者動起來像紙片一樣扭曲。是因為目前的 AI 視頻生成工具(如 Runway, Pika, Luma, Kling)無法理解 UI 圖層和畫面內容的邏輯關系。
這意味著,當我們把那張帶有白框的圖片扔給 AI 去生成視頻時,AI 并不會認為那個白框是一個「懸浮的界面」,它只會覺得白框是畫在地上,或者粘在人臉上的一部分紋理。
所以當人動的時候,AI 會試圖把這個白框像紋理一樣扭曲,或者干脆把它留在背景里。
而要完美實現,我們想要的「疑犯追蹤」效果(人走動,框跟隨,放大圖也跟隨),Gemini 來說,單純靠提示詞是做不到的。于是,它的建議是,采用分層制作的專業工作流,即通過后期來補上去。

既然是 AI 工作流,怎么能交給后期。這是我們在可靈里面實現的效果,雖然這個突出的人物框,應該跟隨著視頻移動,不能遮擋到主角,但這個完成度已經非常接近目標了。
提示詞:基于這張圖片生成監控視頻。 畫面里那個穿黑西裝、提紅色公文包的男人正在快步向前走。 請注意: 他的臉部必須一直被那個白色的方框套住。 哪怕他走動了,這個白色的方框也要像貼紙一樣死死地粘在他的臉上。 男人走到哪里,這個方框就必須跟到哪里,絕對不能掉下來,也絕對不能留在原地不動。 只要畫面里有人,他的頭上就必須畫著這個框。 右上角的大頭照和連接線也要一直顯示,跟著人一起動。 保持監控那種模糊、有顆粒感的畫質。
80% 是 AI,手把手教你復刻真實視頻
看到這個視頻的第一眼,你會懷疑這是由 AI 生成的嗎?
視頻來源:X@SoCal360
網友們一開始都以為這是一個 AI 視頻,有專門那種檢測視頻是否由 AI 生成的賬號,在評論區點出,這個視頻有 80% 的幾率是由 AI 制作。
直到原視頻作者放出了另外一個角度的視頻,才知道這是迪士尼為了宣傳自己的劇集《波西·杰克遜》,專門做的「8D」廣告,加了水花四濺的真實環境特效。
這種「打破次元壁」的特效,第一眼確實很驚艷,就像在大部分商場的裸眼 3D 剛推出時,就被很多人說是用后期制作的。
如果你也想做一個類似的 2D 視頻和現實世界結合的視頻,或者直接復刻這種真實的視頻;其實現在的 AI 也已經能做到不少。
![]()
1. 截圖視頻的首幀圖,要求 Gemini 提取圖片的提示詞。
2. 使用 Nano Banana Pro 替換大屏上的圖片,生成視頻首幀圖。(更直接的做法是要求 Nano Banana Pro 替換廣告牌上的內容就可以。)
3. 把原視頻發給 Gemini,問 Gemini 如果要做一個類似的視頻,應該用什么提示詞。
4. 修改提示詞,在視頻生成模型里面多次嘗試。
![]()
Gemini 同樣支持上傳視頻進行分析
而在可靈視頻生成里,我們可以直接上傳視頻作為參考,而不僅僅是局限于文字提示詞和首尾幀圖片、或者參考主體圖片等。

到底該如何看待這些 AI 視頻呢,《阿凡達:火與燼》還有幾天就要上映了,電影導演詹姆斯·卡梅隆再次向媒體強調,在《火與燼》中沒有使用生成式人工智能,并承諾《阿凡達》系列電影不會取代演員。
在他看來,AI 只是重復地使用過去的藝術品,沒有任何的原創性。他特地區分了,用于后期合成視覺特效的人工智能工具,認為它們可以降低成本;而完全的生成式 AI 只會帶來更廣泛威脅。
![]()
AI 視頻的發展,也許還復刻不了《阿凡達》。
但在大熒幕之外,它確實能讓我們離想象中的「瘋狂動物城」更近一步;無論是做個游戲 DEMO,還是復刻一段特效,只要我們有想法,都可以試著做自己故事的導演。
所以,別光看著那些超級創作者們的演示眼饞了,玩法和提示詞都在上面,快去試試看吧!
歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.