我有一個判斷:
世界模型生成的內容,未來的主要消費者,可能不是人,是 Agent
愛詩做的通用實時世界模型 PixVerse R1,這次做了一輪大更新。720P 高清實時生成全面開放,畫面穩定性提了一檔,UGC 創作者社區正式上線,同時面向外部開放世界模型 API 接口(邀請制)
在這里申請:https://aisphere.feishu.cn/share/base/form/shrcnV1ZJhUDBLWJ8vub36t3z4f
可能有些朋友沒見過 R1,先說清楚它和現在市面上所有 AI 視頻工具的區別
現在的 Sora、可靈、Runway、海螺,邏輯都一樣:寫一段描述,等渲染,拿到幾秒到十幾秒的成品視頻,想改就重來
R1 做的事不一樣。你給它一個起始場景,它會一直往下生成。持續的、沒有時間限制的畫面。你隨時可以打字或者說話來改變劇情,它實時響應
一個跑不停的世界,和一段幾秒的視頻,根本不是一回事
這些畫面都在持續跑著,沒有固定的結束時間,角色自己在動,鏡頭自己在切,劇情自己在往下走
你不說話,它自己演
它編出來的劇情走向,跟人類的敘事直覺經常不一樣。人寫故事習慣起承轉合,有節奏。R1 不管這些,它按自己對世界的理解去推。有時候生成出來的轉折,你會覺得這個邏輯好像只有 AI 自己能看懂
看到這里,回到開頭那個判斷
這些持續生成的畫面,到底是給誰看的
聊 AI 視頻的時候,大家會不自覺地在一個框架里想問題:畫質夠不夠高,時長夠不夠長,鏡頭語言夠不夠專業,故事夠不夠打動人
這些考量背后有一個前提——所有的「好不好」,都是按人類的審美、人類的注意力、人類的情緒共鳴來評判的
當你還在想「怎么讓 AI 幫人出更好的視頻」的時候,思考已經被這個前提限住了
Google 之前做了一個東西,直接把這個前提換掉了
他們有一個 Agent 項目叫 SIMA 2,能在 3D 環境里自己理解目標、自己規劃路徑、自己執行。關鍵的一步:他們把 SIMA 2 丟進了 Genie 3(Google 的世界模型)生成的世界里
SIMA 2 在 AI 生成的世界里自己走,自己試錯,自己學。失敗的任務,幾輪自我訓練之后就能完成。不需要人類標注數據,不需要人類提供游戲錄像
Google 管這個叫「自我改進循環」。Agent 在 AI 生成的世界里試錯,Gemini 對行為打分,結果存進經驗庫,下一代 Agent 在這個基礎上繼續訓練。每一代比上一代強,人不需要介入
![]()
往下想一步
世界模型生成世界,Agent 在里面訓練自己
訓練完的 Agent 能力更強,需要更復雜的世界來繼續訓練。世界模型和 Agent,互相喂
在這個循環里,世界模型生成的畫面、場景、物理規則,全都是給 Agent 消費的。人可以看,但人看不看,不影響循環轉下去
Token 的主要消耗者正在從人變成 Agent。一個人可以同時跑 10 個 Agent,每個 Agent 每天調用幾千幾萬次接口。世界模型把這個邏輯往前推了一步——Agent 所消耗的,不光可以是文字 Token,還應該是視覺世界。需要在 AI 生成的環境里走動、試錯、理解物理規則、練習交互
R1 這種能實時、無限時長生成的世界模型,最大的下游用戶可能根本不是人類創作者
那問題就來了
如果世界模型的第一批重度用戶不是人,PixVerse 這次更新的 UGC 社區、創作者模板庫、720P 畫質,這些全是面向人類用戶的功能
這中間有一個張力
也許恰恰是因為現在面向人類用戶把實時生成的體驗做到位了,底層的推理效率、畫面一致性、交互響應速度這些硬能力才能被逼出來。等 Agent 大規模消費世界模型的時候,這些能力是直接能接住的
R1 能做到實時,核心是把擴散模型的采樣步數壓到了 1 到 4 步(傳統方案跑 50 步以上),再加上自回歸流式生成做到逐幀預測、理論無長度限制。代價也有,長時間生成有誤差累積,物理渲染精度為了實時做了妥協,PixVerse 自己在技術報告里也提了
這次更新還有一個值得注意的點:Omni(自研原生多模態基座)的完整能力第一次面向用戶開放。文本、圖像、音頻、視頻統一編碼成連續 token 流,畫面跑著的同時聲音也在實時生成,環境音、人物語音都跟畫面對得上
![]()
https://realtime.pixverse.ai/ 包括我自己在內
之前想 AI 視頻這個賽道的時候,默認就是在想「怎么幫人出更好的視頻」。但如果把 Google 正在做的事情和 R1 放在一起看,這個賽道正在長出一個完全不同的下游
也許今天面向人類創作者做的這些功能,最終的價值不在于幫人拍出更好的片子,而在于它在這個過程中,把世界模型的實時能力打磨到了 Agent 能用的程度,去爭取入場券
最后,別忘了,R1 的 API 已經開了,在這里申請:https://aisphere.feishu.cn/share/base/form/shrcnV1ZJhUDBLWJ8vub36t3z4f
![]()
API 申請頁面
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.