網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Pixverse悄悄上線世界模型R1，我做的AI視頻能無限實時交互了

2026-01-14 14:04:00　來源: 卡爾的AI沃茨

北京舉報

分享至

AI視頻的下一步會是什么？

更快？更清晰？更可控？這些點都很明確了，

但我確實兒沒想到，我26年先看到的會是這樣一個，

能夠一邊打字一邊實時生成的新視頻生成模型，也可以叫實時世界模型，

Pixverse R1

可能我這么說，大家還感受不太到，直接給大家看一個case。

試玩demo https://realtime.pixverse.ai/

這個過程最頭皮發(fā)麻的地方在于，世界是連續(xù)的。

不是重新生成了一個新視頻，而是在剛剛那個世界的基礎(chǔ)上，實時地為林克裝備了一把武器。這感覺就像你在玩游戲時，突然擁有了開發(fā)者權(quán)限，可以隨時用語言為游戲增加新的元素。

這段演示里還有一個細節(jié)，當(dāng)指令變得復(fù)雜，比如讓怪物追趕林克時，怪物的行為會有些笨拙。

這種不完美反而證明了它不是一段預(yù)設(shè)好生成好拼接好的AI動畫，

而是一個真的擁有初步物理和行為邏輯的世界。

可能它的清晰度還不太完美，

但仔細想想從360p的AI視頻畫質(zhì)到穩(wěn)定低價的1080p，我們只用了18個月。

所以我根本不擔(dān)心這個問題，我關(guān)心的是它在根據(jù)我的指令，實時地進行演算。

這種可被觀察的演算過程，正是它與傳統(tǒng)AI視頻最大的不同。

修的都不是同一個體系，而且從他們技術(shù)報告上看，這個視頻能自己無限期演下去。

技術(shù)報告 https://pixverse.ai/en/blog/pixverse-r1-next-generation-real-time-world-model

R1叫世界模型，3D模型也叫世界模型，Banana2也叫世界模型，

用人話來說，世界知識就是給生成內(nèi)容裝上一個能自洽的底層引擎，讓它不止能把畫面長得像，還得把因果，物理，常識都對上號。

經(jīng)得起推敲的，不會穿幫的，能按照你模糊的提示語補充細節(jié)的。

打開Demo，打開麥克風(fēng)，就這樣一邊說話，R1一邊就把劇情全出了。

聲畫一體的Sora和Veo都很強大，創(chuàng)作流程基本上也都是許愿-等待-開獎。

當(dāng)我寫下一段幾百字的咒語，點擊生成，然后就是盯著進度條等。幾分鐘，甚至十幾分鐘后，才能打開那個盲盒。運氣好，開出神作；運氣不好，人物崩了，物理飛了，只能自認倒霉，回頭再去改那段天知道哪里不對的咒語，然后開始新一輪的抽卡。

Veo3.1還可以用json約束一下，但很多別的視頻模型還是要慢慢磨自然語言。

Pixverse這個就給我一個很新的感受，

它的整個過程其實有點像是導(dǎo)演在現(xiàn)場指揮演員。

你可以設(shè)想一下，在一個電視劇或電影的片場，演員在表演時，導(dǎo)演有時會在畫外音中進行一些實時指導(dǎo)，告訴演員如何去演、做哪些動作，或者表情哪里不到位。

這樣的實時指導(dǎo)就非常像我現(xiàn)在用PixVerse R1的感覺，通過打字告訴視頻，我需要接下來的這個人物去進行怎樣的動作，或者進入到什么樣的場景。

這種交互體驗真的蠻能圓我導(dǎo)演夢的。

比如這個太空駕駛的場景，

一連串的文字像寫劇本一樣，實時駕駛著飛船逃離地球、飛向月球、遭遇神秘光線、最后被巨大的土星所震撼。我感覺自己不再是觀眾，而是第一人稱的導(dǎo)演。我輸入的每一個字，都像是在給飛船添加燃料，驅(qū)動著它飛向我想象中的下一幀。

再比如這個，直升機飛越巴黎時，輸入突然天空轉(zhuǎn)暗，電閃雷鳴，畫面立刻風(fēng)云突變；接著輸入“遠處一個巨大的煙花綻放”，天空中真的就升起了一朵煙花，天氣也隨之轉(zhuǎn)晴。整個環(huán)境和特效都能配合著指令實時做出互動，是一個非常連續(xù)性的展示。

你就看這個Pixverse實機操作的錄屏界面，我感覺這玩意兒根本不只是一個視頻生成器，更像是一個可以被語言實時編程的微型世界。

我就好奇了，這背后到底是怎么做出來？為什么要做一個跟別人不一樣的？

我去啃了一下他們的技術(shù)論文，

用人話翻譯一下，R1能做到這個實時生成的效果，主要靠這三樣：

第一個是叫Omni的原生多模態(tài)大模型。

你可以把它想象成一個從小就同時學(xué)習(xí)了看、聽、說三種語言的天才。它不像別的模型需要把音視頻翻譯成文本才能懂，它天生就能在一個系統(tǒng)里，同時理解視頻、音頻和文字。這讓它的反應(yīng)快得像是本能。

第二個零件是一種叫自回歸的機制。

這東西就像一個擁有超強短期記憶的說書人，它永遠記得自己上一秒講了什么，所以下一秒的故事，總能和前面無縫銜接。這保證了視頻可以像一條無限的河流一樣，持續(xù)地連貫地生成下去。

最后，也是最關(guān)鍵的，是一種叫即時響應(yīng)引擎（IRE）的技術(shù)。

如果說傳統(tǒng)AI視頻生成，像是搭樂高，需要一步步拼接（幾十步的采樣），IRE就像是變魔術(shù)，它能直接預(yù)測出最終成品的輪廓，然后用極少的步驟（一到四步）就把它變出來。

這些正是它能實現(xiàn)實時交互的秘密武器。

所以，它到底用在哪？

我個人是感覺，PixVerse R1這類實時模型，并非要取代Veo們在敘事性短片創(chuàng)作上的作用。它們其實可以并駕齊驅(qū)，Sora們在追求成為頂級的電影工作流，

而R1正在努力成為一個充滿無限可能的互動娛樂引擎。

它真正開疆拓土的地方，在于那些極度依賴實時交互的領(lǐng)域。

比方游戲，想象一下你走到NPC面前，不需要幾周目才能引導(dǎo)變化，不再是從預(yù)設(shè)的三個選項里選一句對話。你可以自由輸入任何你想說的話，NPC會根據(jù)他的性格和你們之前的經(jīng)歷，實時生成獨一無二的表情和互動場景，

我甚至可以開個上帝模式，對游戲世界本身下指令，

我希望我這個賽博釣魚佬可以回回上魚，那我真的要笑到合不上嘴了

也就是說，游戲，將從一個玩家只能被動體驗的故事，變成一個真正可參與的世界。

再再比方說互動電影，

現(xiàn)在去大商場體驗4D電影都要out了，我大膽想象一下，我可以擺脫A/B選項式的偽互動，隨時暫停，給主角下達一個全新的指令，別相信他，先看看他口袋里藏了什么，

然后電影會為你即時地生成一段新的故事脈絡(luò)，我就經(jīng)常在想要是故事不會結(jié)束就好了。

盜夢空間這個陀螺我是真希望能看到它停下來，被一個新的幕后之人拿起來

寫到這里，

我突然想到了一個可能離我們每個人都更近的使用場景。

你有沒有過這樣的經(jīng)歷？

做了一個無比清晰的奇幻夢，畫面感強到你自己都起雞皮疙瘩，

但我醒來后想跟朋友描述，搜腸刮肚用了無數(shù)的形容詞，要不就發(fā)現(xiàn)忘了，要不就是形容不出來，

什么叫我在鰲太線拿著四塊壓縮餅干在大爺海煮火鍋啊（我至今形容不出來神秘園究竟在我腦子里留下了什么）。

這還能聯(lián)系上一個科學(xué)名詞，

夢境遺忘（dream amnesia）

夢大多發(fā)生在REM期（快速眼動睡眠）或臨近醒來的過渡階段，醒來屬于從一個腦狀態(tài)跳到另一個腦狀態(tài)，所以會出現(xiàn)一種典型的感覺，

就是我知道我剛剛看到了什么，但現(xiàn)在就是想不起來。

因為在夢里體驗的是視覺，空間，情緒，氛圍，象征感，但醒來我要把它壓縮成線性的句子的話，這個過程中會出現(xiàn)一種夢的不可言說感（dream ineffability）。

這時候想要最大程度保證夢不被遺忘，可以先寫關(guān)鍵詞，不要追求完整敘事，比如，銀色樓梯，潮濕的風(fēng)，我逃跑的時候踩空了，也可以用感官描述替代抽象形容詞，光像浸水的霓虹、空氣里有鐵銹甜味、遠處的聲音像倒放的合唱。

說實話，我每天都在跟這種轉(zhuǎn)達的損耗作斗爭。

但R1這類實時模型的出現(xiàn)，

或許為我們提供了一種全新的表達方式。

它能讓我能把那個轉(zhuǎn)瞬即逝的夢境，用一種更直觀，更無損的方式復(fù)現(xiàn)出來。

它將創(chuàng)作的反饋周期從數(shù)小時甚至數(shù)天，壓縮到了零。

而這種即時反饋極大地釋放了我的實驗精神和表達欲望。

現(xiàn)在已經(jīng)可以排隊內(nèi)測了，

目前能體驗360p了，

過幾天還能用上720p，

趁著還沒收費之前，

我要多跑五六七八九十個。

@ 作者 / 卡爾

最后，感謝你看到這里如果喜歡這篇文章，不妨順手給我們點贊｜在看｜轉(zhuǎn)發(fā)｜評論

如果想要第一時間收到推送，不妨給我個星標(biāo)

如果你有更有趣的玩法，歡迎在評論區(qū)和我聊聊

更多的內(nèi)容正在不斷填坑中……

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

5000萬用戶、5000萬美金ARR,第一AI創(chuàng)作消費平臺要做AI時代Roblox

機器之心Pro 2026-01-26 14:05:13
0 跟貼 0
世界模型==VQA？機器人不用想象畫面，預(yù)測語義就夠了

機器之心Pro 2025-10-28 10:14:22
1 跟貼 1

又一個火出圈的AI應(yīng)用！個人AI助理的雛形：Clawdbot來了

華爾街見聞官方 2026-01-26 08:46:33
7 跟貼 7

Skills剛火，就有零Skill的Agent來了

量子位 2026-01-26 23:39:04
2 跟貼 2
拳打亞馬遜、腳踢谷歌TPU 微軟發(fā)布新一代AI加速器Maia 200

財聯(lián)社 2026-01-27 01:12:56
0 跟貼 0

微軟升級自研AI芯片，號稱吊打亞馬遜、超越谷歌

華爾街見聞官方 2026-01-27 06:41:42
0 跟貼 0

DeepSeek-R1推理智能從哪來？谷歌研究：模型內(nèi)心多個角色吵翻了

機器之心Pro 2026-01-26 14:15:48
0 跟貼 0
撒10億鋪路，“派”馬化騰推銷？

虎嗅APP 2026-01-27 04:52:05
0 跟貼 0

F-22戰(zhàn)斗機啟動引擎，一股青煙噴涌而出

裝甲鏟史官 2026-01-25 12:20:23
19 跟貼 19
那個用半成品刷爆SOTA的Qwen3超大杯推理版，現(xiàn)在正式上線

量子位 2026-01-26 23:45:47
0 跟貼 0
2026款凱迪拉克V16，V16引擎+千匹馬力，這才是天花板

烏雅愷歌 2026-01-27 05:06:02
0 跟貼 0
本田系復(fù)古踏板NWF150發(fā)布，顏值不錯引擎靠譜，還有豐富配置

騎士分享 2026-01-24 09:15:03
15 跟貼 15
川崎最野農(nóng)用車 Stockman 載貨又扛造

MOTO 2026-01-23 11:05:23
0 跟貼 0
聽，霞光里，引擎再次轟鳴

環(huán)球網(wǎng)資訊 2026-01-27 07:40:12
0 跟貼 0
美國“林肯”號航母打擊群已經(jīng)抵達中東

央視新聞客戶端 2026-01-26 07:51:02
23365 跟貼 23365
“開源版賈維斯”一夜席卷硅谷！Mac mini因它賣爆

量子位 2026-01-26 14:32:52
58 跟貼 58
出大事了，烏克蘭發(fā)起大規(guī)模襲擊，普京不忍了，俄軍收到一道指令

侃侃世界之最 2026-01-25 15:47:09
0 跟貼 0
實力對等下的和平：中美軍事博弈的深層邏輯

青杍無夢 2026-01-26 11:48:03
0 跟貼 0
女子和男友生氣，直接給自己氣成模型了，男友差點笑進ICU

籃球搞笑 2026-01-26 16:36:58
1 跟貼 1
扥著舌頭穿！小孩哥自己穿鞋聽到指令不理解但照做

青夢白話 2026-01-25 16:45:24
1 跟貼 1
丹麥網(wǎng)友"眾籌"1萬億美元收購加州美國網(wǎng)友熱烈回應(yīng)

紅星新聞 2026-01-26 17:52:54
2454 跟貼 2454
不忍了！孫濤痛哭回應(yīng)閆學(xué)晶事件，一夜頭發(fā)花白！

軒逸阿II 2026-01-27 02:19:15
4 跟貼 4
【城事】上海華亭賓館改造收官，2月10日試運營

上觀新聞 2026-01-26 19:57:15
114 跟貼 114
關(guān)于多模態(tài)大模型Token壓縮技術(shù)進展，看這一篇就夠了

機器之心Pro 2026-01-26 16:15:06
0 跟貼 0
劉強東臘八下單萬件年貨送老鄉(xiāng)，今年還將為光明村打造村晚

極目新聞 2026-01-26 13:27:18
43 跟貼 43
商務(wù)部：一視同仁支持外企參與提振消費、政府采購、招投標(biāo)等

證券時報 2026-01-26 15:43:03
4665 跟貼 4665
學(xué)霸思維訓(xùn)練：用一半模型求面積

公考客棧店小二 2026-01-26 08:00:00
0 跟貼 0
孫濤辟謠不過24小時，擔(dān)心的一幕就發(fā)生了，評論區(qū)輿論一邊倒

小舟談歷史 2026-01-25 09:37:11
2 跟貼 2
克里姆林宮：俄方不再與卡拉斯打交道

參考消息 2026-01-26 15:32:08
1028 跟貼 1028
委內(nèi)瑞拉代總統(tǒng)，突然怒懟美國指令，特朗普當(dāng)初留命后悔了

正直小墨 2026-01-26 18:31:16
1 跟貼 1
不止于Prompt：揭秘「神經(jīng)網(wǎng)絡(luò)可重編程性」

機器之心Pro 2026-01-26 13:36:01
0 跟貼 0
高壓鍋秒變二戰(zhàn)引擎？硬核拆解蒸汽機原理

愛笑無厘頭 2026-01-23 21:42:44
1 跟貼 1
喜劇演員孫濤因無端網(wǎng)暴落淚：我沒有“力挺閆學(xué)晶”！

地理三體說 2026-01-25 21:04:09
7 跟貼 7
烏克蘭軍隊攻擊俄軍車隊，操作界面現(xiàn)大段阿拉伯文，目標(biāo)是 1

搞笑嘻哈哈 2026-01-23 00:00:00
0 跟貼 0
三分之一學(xué)校不足200人但崇明拒絕“一關(guān)了之”

看看新聞Knews 2026-01-27 00:45:03
54 跟貼 54
賬戶里突然多了20萬！女子10年前買的10萬元白銀被徹底遺忘現(xiàn)在市值接近32萬元

閃電新聞 2026-01-26 12:02:06
706 跟貼 706
居民樓出現(xiàn)一條50米長裂縫，“里面結(jié)構(gòu)都露出來了” 業(yè)主認為與底層商鋪煙管爆炸有關(guān)

大風(fēng)新聞 2026-01-26 10:54:04
375 跟貼 375
他們，為何都在走向同一個黑洞？

秦朔朋友圈 2026-01-27 07:07:45
0 跟貼 0
2025全球車企銷量TOP10

大象新聞 2026-01-26 11:01:05
94 跟貼 94
馬犬是個邏輯鬼才！因為這個原因，電師傅卻以為我快嘎了！

寵兒日記 2026-01-23 10:42:23
0 跟貼 0

卡爾的AI沃茨

前大廠算法工程師，3家科技公司技術(shù)總監(jiān)｜致力打造最系統(tǒng)的Al學(xué)習(xí)體系，讓1萬人通過Al提高生產(chǎn)力

199文章數(shù) 84關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戲

旅游

時尚

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最正宗的紋飾是什么？
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

Pixverse悄悄上線世界模型R1，我做的AI視頻能無限實時交互了

理想開始關(guān)店“過冬”，否認“百家”規(guī)模

上海一女子嫌風(fēng)水不好 屢次掰歪小區(qū)兩塊反光鏡

上海一女子嫌風(fēng)水不好 屢次掰歪小區(qū)兩塊反光鏡

叛逆的大公子，要砸了貝克漢姆這塊招牌

張雨綺被抵制成功！遼視春晚已將她除名

從美式斬殺線看中國社會的制度韌性構(gòu)建

賓利第四臺Batur敞篷版發(fā)布 解鎖四項定制創(chuàng)新

態(tài)度原創(chuàng)

云游中國｜格爾木的四季朋友圈，張張值得你點贊

魔獸世界：時光服再次調(diào)整，熔火之心迎來削弱，玩家該如何選擇？

甜了10年，超多曖昧細節(jié)，全網(wǎng)求他倆原地結(jié)婚

上海一女子嫌風(fēng)水不好屢次掰歪小區(qū)兩塊反光鏡

上海一女子嫌風(fēng)水不好屢次掰歪小區(qū)兩塊反光鏡

賓利第四臺Batur敞篷版發(fā)布解鎖四項定制創(chuàng)新