寫在前面:
這是《405游局》播客第一次嘗試用文字稿的方式來呈現我們的內容,之后每一次非閑聊局的話題,我們也都會嘗試用文字的方式加以記錄。在形式的選擇上,本次采用了完整的文字稿,內容較多、閱讀時間較長,但能更好的保留對談中的細節。我們也同時在考慮未來是否會采用精簡的文章,更加符合閱讀習慣。如果聽友們有任何建議,歡迎與我們聯系。
本文較長,約24000字,分為四個部分討論了:我們對于AI生成游戲的初嘗試、AI生成游戲的產品形態、UGC社區發展的思考以及創業者的機會。
疊個甲:文字直接從播客錄音導出,難免還是會有口語化的部分,請見諒~
本期錄制時間:2025.12.20
播客音頻(小宇宙鏈接):
![]()
2025年下半年開始,尤其是在Gemini等模型上線后,我們觀察到“AI生成游戲”這個產品方向的探索越發熱鬧了 。最近我們也密集看了一些創業項目,嘗試了各種AI生成游戲的工具,包括最早的Rosebud,也包括最近阿里出的靈光 。
AI生成游戲必然會帶來一個老生常談的話題,就是UGC社區 。AI的到來對于UGC社區的成長真的只是Buff加成嗎?帶著這些觀察和問題,我們也想聊聊對于這個探索方向有哪些思考。
01.AI生成游戲的初嘗試
筱寧:我們就從一些最近大家的嘗試和觀察開始。你們倆最近都嘗試過哪些AI生成游戲的小工具,感覺怎么樣?
少云:我比較粗淺的嘗試了一些,像Gambo、Rosebud、Aippy,包括像Google的AI studio,可能不完全是游戲方向的。比較眼前一亮、或者說帶來其他方面一些啟發的還是回到阿里的靈光AI,這是比較大的一個話題,我可能后面更詳細展開。
我的嘗試會簡單一點,因為它宣傳的就叫做一句話就能做游戲。一句話說我要做一個祖瑪,做一個俄羅斯方塊,或者做一個Flappy bird類似這樣的游戲,目前其實已經能夠把所謂這種小游戲用一句話、可能只有20個prompts就能搭出來了。這個流程已經跑通了,這也是現在看到的一個能力的邊界。
最近帶給我不太好的體驗的方向,可能是往往大家會把這件事情的上限講到非常高。好像說一句話能做游戲,那是不是做游戲這件事情就會被替代掉?這也是今天可能想要去展開探討的一部分。
孫皓:我這邊的話分幾個不同的方向。第一個比較native的類似于用Cursor,Claude code,Copilot這些偏向于這種IDE的插件,或者是IDE本身。比較傾向于是工程師的角度來看,其實現在像cursor給他一個比如20到30字的一個prompt,讓他生成一個簡單的2D游戲,我覺得現在他做的已經蠻好。
他的做法比較傾向于基于javascript,從零搭出來一個游戲。他會先搭一個簡單的引擎,在這個簡單引擎上再把這游戲框架寫出來,這種形式相對來說比較適合做demo。他也能簡單的使用一些引擎,比如像Phaser這種做2D的,或者Godot這種都可以去寫,但是寫起來的bug還是比較多的一個狀態。
第二種的話是MCP,比如說包括pixso lab,它會提供一些像剛剛說的cursor或者claude可以去直接用的這類MCP。他用這個MCP,通過一些像style transfer的方式,把美術資產也生成了。這種生成結果可以保證在實際去做游戲生產的時候,素材可以達到風格統一。在做2D游戲上面,效果還是不錯的。但是3D游戲的話,目前還沒看到特別強的MCP。
第三個的話就是端到端的游戲平臺。比如說像gambo、Rosebud、靈光也算,但是靈光可能不是專門去做游戲的。Gambo和rosebud的話,gambo會更偏向于做2D,rosebud他自稱是3D游戲的生成平臺。
Gambo后邊用的是Phaser,Rosebud的2D也會用Phaser,3D的話用的是Three.js。基本上用這兩個產品是能做出來質量比較一般、但是比較像03、04年那個水平的那種游戲性挺強,但是比較粗糙的游戲原型。這個目前來說基本兩分鐘就能做出來,然后包括里邊的assets,包括一些音樂等等,都會在里面。
筱寧:其實我們自己拿這種平臺去做游戲的時候,可能還有很多人沒有嘗試過。我非常驚訝的一點是因為我自己用的時候,有時候還會特別詳細的描述我想要一個什么樣的游戲。
然后我第一次看孫皓做游戲的時候,能知道這個事情簡單到什么程度。你要不要說說你當時那個提示詞是咋寫的?
孫皓:對我當時直接寫的就是:“你是一個天才的游戲策劃,你非常懂什么是好的游戲,我現在要做一個泡泡龍,但是除了我要做個泡泡龍以外,我沒有任何的想法,其他全靠你去寫。然后你要把它做到行業尖端的水平,3A游戲的質量”,然后它就開始寫了。
少云:對,當時我也目睹了這個過程,非常的震驚。可能我想象中專業的程序員去講提示詞,會有非常專業的一些框架或者指導。沒想到是一個比我們提需求還更直白的一個狀態。
至少在第一個版本里面,其實做出來效果還挺驚訝的。第一它當然能夠跑通,一開始的時候還沒有bug,一下子做出來就能玩了,然后也非常像模像樣,像回事兒。泡泡龍游戲就被剛才那個有點PUA的提示詞給做出來了。
孫皓:這個提示詞里面大部分還是廢話,但里面重要的點還是說你最后想要什么樣的效果,這個效果下你做了一個泡泡龍,這兩件事比較重要。
其實它跟Gemini3,包括像Claude 4.5以后的這些模型能力是有極大的關系的。尤其像Gemini3的話,它在實際做這個事的時候,不像以前大模型,你提一個很模糊的訴求,他很容易就模糊的給了一個回答。
但Gemini3會有一個很長的thinking的過程,它里面的recursive thinking,會嘗試把你的訴求擴展成非常廣的一個搜索空間。在這個搜索空間之后,逐漸把它轉譯成code的一種語言。
所以它有點像是把我的這種intention轉化成了一個過去的高級語言,你可以把它當成一種超高級的編程語言。
少云:我看到孫皓的這個游戲,或者叫泡泡龍這樣的一個demo,其實也做出來了。然后我們就嘗試給他提一些新的需求,比如我們會覺得說泡泡龍的那個球,在每一個回合,因為它需要給玩家更強的一種壓力,需要你每發一個球,整個泡泡龍的所有的球就會向下落一層,最后比如說觸底了,可能你就輸了,這是我們傳統泡泡龍的規則。
但在剛才的prompts里面,不包含這個規則。所以我們就提了一個類似于說你每發射一個球的時候,整個就會下落一層,但是好像就從頭到尾,反正我們最后給了這樣的提示詞,但沒有搞定這件事情。
孫皓:關于下落這個問題,就相當于我們人類其實把這個訴求給定的非常嚴格。但這個嚴格的訴求,它實際去理解,包括去生成的過程中,對于引擎的理解也好,對這種物理現象的理解都還是偏弱。所以導致試了好幾次,有的會比較接近,但接近的和我們腦海中認為該下落的那個形式還是有一定的區別。
筱寧:是不是因為它是一個現有的游戲類型,所以我腦子里已經有了這樣一個印象,泡泡龍它應該是這個樣子的。當我用自然語言去跟AI做這個交互的時候,這個過程中它的生成效率并沒有非常高效,或者沒有貼合我的預期?
孫皓:有一個主要原因是2D的界面本來對于大模型來說,它的理解難度就會高一點,3D就更難了。3D里有更復雜的assets,還有一些網格這類概念。
我們這么想,大模型本身它是一個線性輸出,它最好理解的其實是線性邏輯。不好理解的是什么呢?如果我用一個二維的概念才能去講清楚的事,他就不好理解。
它比較好理解比如說X大于500的時候就發生碰撞,這個沒問題,因為這是一個很線性的邏輯。但一旦提到需要上面的墻以什么樣的形式下落,然后這個落的過程中要體現出這種可能人類語言也講不太清楚的效果,就比較難。
少云:可能這是一個叫做需求描述,我覺得還是涉及到一些現在AI vibe coding的一些邊界的、本質的東西。
后面我們中間也嘗試了一些亂七八糟的需求,比如做一個超炫酷的效果,我們也沒有具體描述說什么是超炫酷或者效果要加在哪里,但它自己去理解了一下。可能就在每一次發射的時候、產生消除的時候,會瘋狂的炸煙花
孫皓:我覺得它就更容易在一個很模糊的訴求中,給你一種感覺,他做出來結果還不錯;但不太容易在一個尤其你對效果的要求特別高的一個prompt里,給你一個非常還原prompt的一種效果,這是比較難的。
比如說剛剛說那個爆煙花,我看了下它怎么做,他就弄了一堆svg、搞了很多的code能寫出來的特效,這種凡是能code寫出來的,它做的都不錯。但一旦涉及到一些assets,它的理解就變弱了很多。
02.AI生成游戲的產品形態
筱寧:有三類的結構,一個是大模型原生就可以去做游戲;第二種其實叫做一站式生成的everything的平臺,也有很多這樣的平臺,游戲或者交互娛樂算其中一種;第三種就是直接到了游戲。
從生產結果來講,有兩種產品形態:第一種類似Aippy的信息流形態,可能每一個的體驗不超過10秒鐘,修改輪次可能1-2次,比較貼近于AI原生理解、原生生成的東西;
第二種是像我們去做的泡泡龍或者Flappy bird,帶有原生的印象,希望多做幾個關卡,像Rosebud這類貨架式的、多一些深度的體驗。
這兩種形態你們會怎么看?
少云:游戲本質是一種交互體驗,假如完全沒有交互,可能就是抖音,是一個短視頻的觀看體驗。如果把交互的參與程度作為一個很核心的一個維度去考量,把現在所有這些體驗都放到這個維度下面,去拉一根軸,可能這個軸的最淺的、最左端的叫抖音。
再稍微長一點可能有點類似于B站中長視頻,它里面有一點點的交互。原來B站當然也嘗試過交互式的視頻,但那個做的很復雜,有點像影視游戲的感覺。稍微淺一點的可能投個幣,也算是交互,發個彈幕也是,這就是一種在中長視頻里面的一種交互形式。
再稍微重一點,人的卷入多一點,我自己感覺是像抖音濾鏡。抖音有很多濾鏡,人需要利用比如前置攝像頭去去頂個球也好、做一個動作也好、拍一個這種模型的短視頻也好,這個就很模糊了。
抖音濾鏡它是一種游戲,還是一種短視頻呢?它就已經是在臨界點上。
里面比較tricky的點在于抖音濾鏡是有真人的up主、真人的主播去進行一個表演的。這意味著這個真人在這里產生了一種額外的價值,不是說只有濾鏡的一種交互的方式、玩法產生的價值,是這個真人本身他的臉、他的表演的形式也產生了價值。
因為人對人的這種表情和肢體動作的感知是最敏感的、最敏銳的。所以他去看這些的時候,會覺得很好。因為這個舞是這個小姐姐跳的,所以我特別喜歡看;換了一個很魔性的禿頭大叔跳,那也OK,是一種魔性的方向,但是跳的可能是同一個舞。
但是如果一旦這個東西變成一個抽象的,變成剛才說的小游戲的形式,那似乎人的價值,或者叫創作者的價值就在這里一下子就模糊了。
所以我會覺得交互再往前一點,就越過了這條線,到了剛才說的超休閑的游戲。然后再往下的游戲可能變成剛才講的叫做有平臺跑跳的,有Flappy bird,有羊了個羊,抓大鵝這些游戲出來。
再往后可能就是傳統游戲定義里面的東西了,有掛機游戲,有休閑游戲,三消、二合,MMO,最后可能是魂游吧,3A的動作游戲,已經交互到非常強了,這樣的一個軸,就叫做交互參與程度的一個軸。
當然我們現在也不指望AI vibe coding能做一個魂游,3A魂游可能離得非常遠,甚至就我而言,在這上面還是有點偏悲觀,我不太相信AI能完全解決人類交互體驗這件事,我覺得AI它還是一個生產工具。
人跟AI最后的一個區別叫做人是有對內容的消費的需求的,但AI是沒有的。人是怎么消費內容的?它是基于自己過往的生活體驗、生活經驗,而且我是一個物理的人,我需要吃喝拉撒睡,需要有這樣的東西。
最早我們對游戲的定義會說游戲是一種模擬,遠古時代的游戲都是對于生活或者對于未來生活的一種模擬和預演。為什么小貓小狗之間之間要打鬧撕咬,他們在做這樣的游戲,因為他未來要捕獵。這當然是很原教旨主義的游戲的定義。
但這些東西其實產生游戲一個最底層的訴求:就是作為一個人,作為一個生物個體,你是有消費的需求的,但AI是沒有的。
所以AI不會去定義這個交互是好還是壞,最后在這上面缺少一個邏輯閉環。或許在未來的某一天,比如說我們造一個具身智能的機器人,他有充電的需求,他有找一個充電樁的需求,他要在這個環境里面去交互、去生活、去感知,可能有一類游戲是專門滿足這樣的機器人的,因為它也有某種消費的需求。
至少在當下的AI大模型里面,它是一個抽象的東西。所以人有消費的需求衍生出我對于交互體驗是有一個判斷的,我會對這個體驗說好還是不好,這個閉環最后扣在人上面,我不太相信,AI vibe coding能夠解決人類最本質的對于游戲創造、創意以及判斷。這件事情只有人能駕馭,有了判斷才能把整個生產流閉環起來。
孫皓:很贊同,現在從大模型發展的角度來說,也是缺少self rewarding。換句話說,對于模型而言,它沒有跟人類一樣的情緒反饋。他缺乏五官,缺乏對世界的理解。
他的理解往往來自于語料,來自于其他的一些人類所發過的information。但這些信息無法取代它在meta level上有一些被情緒或者被一些本能所驅動著的反饋機制。
如果說沒有這個前提,就會發現我們只能讓模型去模仿人類,或者說去擬合人類的偏好。更高level的角度來說,它沒有辦法形成自己的偏好,或者是真正站在“人類本質上是如何去看待事情”這樣的一個方式來去理解。反過來說的話,像游戲它模擬的往往是很本能的東西。
少云:像弗洛伊德定義的“力比多”的概念,它有幾種沖動,可能叫做戰斗的沖動、源自于死亡的沖動、繁衍的沖動,可能還有其他的一些沖動。這些基礎的沖動,衍生出我的行為。
孫皓:現在大模型在這件事上確實對他的理解還是非常弱的,所以它會導致一個問題,就是他沒辦法評估自己做出來一個游戲,哪怕現在長了眼,他可以去看這個游戲做出來的是不是有bug,這個都沒問題,但他做不到的是我看到了一個沒有bug的游戲,它到底好還是不好。
應該說除非模型的這種機制或者說他的學習方法有一個根本的變化之前,目前還是沒法解決的問題。
筱寧:如果說我們不對AI要求那么高,可能他不去做判斷,也不去做一些篩選。vibe coding這個詞其實是今年才出現的,在整個流程當中,它的角色到底是什么?
包括其實也想問孫皓的,是因為其實低代碼這件事情并不新鮮了。在vibe coding之前有很多的場景,大家嘗試做過一些所謂低代碼的工具。
但確實是在vibecoding來了以后,大家去生產自己的APP也好,或者說游戲也好,變成了一種覺得還挺exciting的事情,那他到底發生了什么變化?
孫皓:我個人的一個體驗就是,UE其實也有藍圖,也有很多方式能夠讓你通過拖拽的形式就能做出來一個不錯的故事流。但這些都是基于一個引擎,這個引擎上面已經有至少十幾年的迭代,這個迭代里面包含了大量的行業知識。
在一個引擎上面去加這些東西,對于一個完全不懂coding的人來說還是沒辦法介入的。但如果是讓我去打幾個字,他就能做出來跟我打幾個字效果差不多的東西,那我這還是挺magic的。
Vibe coding對于工程師來說是非常重要的,可以用它提效十倍以上。但是它更關鍵的確實是對于那些原本沒有任何工程能力的人來說,給了他一個能夠開始設計比如說他喜歡的游戲也好、還是說這種小工具軟件,它都可以去想辦法通過他的語言一次一次的改來去達到目的。這個事兒原來確實是做不到的。
少云:這個話又說回來,就通過語言一次一次能達到目的嗎?剛才泡泡龍的例子好像并沒有達到目的?
孫皓:游戲的vibe coding是比較難的。目前來看的話,其實從小工具的角度來說,因為它比較邏輯化,它的UI不重要,它重要的是邏輯寫的對不對。
凡是這樣的場景,其實目前vibe coding已經做得很好了,甚至說他99%的工作都可以勝任。我現在基本上在做這種web開發的過程中,可能只有5%的時間在寫代碼,剩下時間都是大家去跟AI進行互動。
游戲確實有點特殊。游戲它有兩個挺大的難點,一個難點就是它里邊包含了太多的assets。這還只是2D游戲。3D游戲像剛剛說的,它還包括了其他的包括網格、包括肢體動作,然后里面有很多是沒辦法靠一個視角就能觀察的東西。
這個對于AI來說它更難理解,這是第一點。然后第二點的話,游戲本身是給人玩的,不是給人去解決問題的。凡是玩的東西到底好不好玩,和能不能解決問題,我覺得是很大的一個差別。
筱寧:是不是還有一個原因跟數據也相關,可以用于AI去訓練的數據,這個量級也是不一樣的。像你說web,也是因為它有大量的數據,大量的公域數據。但在一些更復雜的場景,比如說更復雜的一些APP,包括游戲,其實你沒有那么多的數據可以去采集,也會影響到它的生成?
孫皓:我覺得這個非常對。現在的vibe coding為什么在網頁游戲上或者說用Three.js,javascript基礎的這種框架上做得還不錯,主要原因也是因為他的數據量比較大,他看過的網頁至少是夠多的。所以他可以去保證在這種web環境的基礎上能做出來比較好的一個結果。
但是相比之下,比如Unity,Unity數據還相對多一點,但是Unity有一個大問題,就是Unity的版本迭代太多了,以至于它過去的垃圾數據特別多。它的語法變化太大,導致今天再去用AI去寫Unity它經常給你寫出一些過去腳本的一些語法,它自己也會混亂,它也不知道哪個是對的。
因為大部分的項目,其實你如果只看項目code文本本身,是看不出來它到底是哪個版本的。除非你把整個項目,包括它的配置文件都看了,你才知道是什么版本。所以其實AI學習這種像Unity、包括UE的這些代碼都會面臨這個問題。
相對來說的話,好的、優質的數據是比較少的,尤其現在這個版本下的優質的數據就更少了。這也是為什么說現在那種game engine上面去做了很多這種vibe coding的嘗試,但是他們本身還是積累的債太多了,然后導致他確實不夠native。
或者說現在如果真的從零開始開始做一個engine,然后面向vibe coding去做的話,也不會按照那個形式來做。
少云:我其實想補充有兩點:我們在做游戲的時候,就像比如說生產一輛汽車或者一部手機。你作為蘋果或者作為小米在造車,在做的第一件事情是什么?或者我們本質上在做什么?是在手搓一個手機,在擰螺絲嗎?都不是。我們在做一個生產線,一個流水線,這個流水線在游戲里面就被稱之為編輯器。
所以我們做的東西,其實編輯器的形式它不是那么拘泥于說一定要是一個藍圖,一定要有什么上下左右按鈕,或者像是War3 Editor這樣的才叫做編輯器。
原來我們做的所有填表的工作,比如像excel,它其實就是一個最好用的編輯器。它是面向人類的,比如說面向數值策劃的一個編輯器。這個編輯器其實是非常高效的,能夠去控制你想要的東西的一種數據結構。
比如說一個人他需要升級,每一級需要有經驗值。現在這個東西如果用vibe coding,你需要去念第一級需要10點經驗、第二級需要20點經驗……這樣念一遍,效率高嗎?還是說我直接在excel上一張表拉下來就效率更高?
所以編輯器不是說vibe coding它就是最好的形式,還是要根據我們具體的設計需求,有時候excel反而是更快的。這是我想補充的第一點。
第二點的話,我們在定義vibe coding,或者說在定義這件事情的時候,剛才說有兩個大類,一類是叫小游戲信息流的,一類是叫做可能稍微在垂類里面深入一點的,像橫板卷軸跳躍這種品類的。
為什么是這樣的一個結果?我們現在眼睛只看到了很新鮮的出現的這樣一種編輯器的形式,它的邊界或者說它的能力范疇,和剛才講的這兩種形態是最合適的。
為什么不一出來就做一個重度的MMO或者說一個肉鴿或者數值導向的游戲?或者掛機類的游戲呢?因為這是它不擅長的。就現在投資領域來講可能不夠sexy,它沒辦法講個好聽的故事。因為那些東西還是用excel效率最高,所以我們不去講這個東西,我們最后變成去講更加好聽的,更加高大上的故事。
但真正的游戲體驗,其實不是只有這種小的,甚至小的那部分,現在來看可能是占比反而是較少的部分。怎么去看剛才說的兩條線的東西真正在落地角度的價值?
第一條價值我覺得就跟剛才說的,他最后是不是會變成抖音濾鏡?我們要想的是把所有在做這件事情的創作者的價值能夠更多的融入進去。因為現在的prompts一股腦兒就20個字,那孫皓來說,還是小寧來說,誰來PUA,不是結果是一樣的嗎?大家生產出來的東西全是同質化的,那差異度在哪里?這是一個核心的問題。
第二個問題是說所有這些生產出來的那些交互,其實它相對剛才講的像抖音、視頻類的,他對于玩家的門檻還是高的。你要想象一個玩家每5秒鐘要換一次交互形式。我玩了Aippy里面有一些挺魔性挺有意思的交互,就是一個哈基米轉瓶蓋,你點住哈基米,它會轉轉轉,還有聲音,然后把瓶蓋什么轉起來,就很無厘頭的一個東西,很有意思。
但你第一眼看到它根本不知道該怎么玩,沒有人知道,因為就只是一個交互而已。然后你隨便去點,可能大量的所謂的玩家或者泛用戶,他并沒有這種耐心或者注意力的資源,要每5秒學一個新的交互形式。這個門檻相對短視頻來講,我覺得要高得多得多。甚至相對于小游戲來講,我覺得都要高。
回到更加落地的,剛才我們已經有一些品類像橫版的卷軸跳躍,包括泡泡龍。我相信vibe coding一定能在里面發揮價值,但是比如橫版卷軸跳躍,最簡單你要編輯那些個彈跳的關卡,一關一關要去過。
這是一個2D的編輯器來的效率更高,還是我口述說你給我改第三排第七個方塊改成什么樣效率更高,還是說我就反拿個鼠標點點點,我直接就改掉了。甚至我拿個excel表,我填數字,都比這個要快得多。
我們還是拋開太fancy的部分,我們回到說現在真的他能夠給我們傳統游戲體驗,不是說excel表就一無是處,它還是有它效率更高的部分,那兩者是不是能更多的去結合一下。
像剛才孫皓也提到,就是像web的開發,可能95%已經全部是PUA的部分。回到游戲,因為有交互,這個是vibe coding不太繞得過去,也不太做的好的部分。傳統的編輯器、傳統的開發流,還是有很大價值的。
筱寧:其實我們看到好多這種做agent,不管是一站式的還是直接做游戲的,都會有一個方向。大家就去做模板,做了模板以后,然后大家去做remix。這個形式本身是不是一個解法?
少云:我認為是的。可能一些現在并不那么fancy的工作,做出來之后你需要針對比如橫版跑跳里面的一些像剛才講的,他的痛點在哪里?他的痛點是游戲資產沒有對齊。
我現在如果說一個提示詞,然后這個資產就能生產出來,并且生產出來的這個資產它是能走跑跳的,它是有基礎的3C的交互,它還有叫做戰斗的東西。然后我給他說一個技能,他這個技能就能把所有的這種資產全部拼在一起。我說有一個火球,他就得拼一個火球出來。
最近玩了一個游戲叫《球比倫戰記》,它里面會把各種各樣的技能,排列組合能夠去融合、進化出來。像這樣的東西,這種資產它是不是能夠純粹的基于剛才講的這種提示詞能夠去生產出來。
這些工作其實他沒有那么高大上,它有很多是對齊的工作,是比較細碎的一些事情。但這些事情我覺得是有價值的,因為他就把開發流里面的一個點其實打通了。
打通了之后這可能都不叫vibe coding了,其實可能叫資產生成也好,或者叫什么也好,就能夠把具體的體驗通過一句話或者一個提示詞就能夠生產出來,覺得這件事情反而是更具有落地價值的,也是大家如果想要去用的時候,很容易就能上手,能去生產
筱寧:remix也有兩種可延展的形態。第一種最簡單的相當于我有一個別人做好的模板,但可能比如說你做了一個橫版卷軸跳躍,我希望那個跳的東西是皮卡丘,那我可能就remix下用提示詞的方式在跟AI進行一輪溝通,但這個可能改的還是比較簡單的一些東西。
第二種就變成了remix之后我再做個編輯器,但如果說我又回到編輯器了,那就又回到那個問題了。那在這其中加入了一步能夠自然語言對話的這個價值會在哪里體現出來?
孫皓:我覺得就像剛剛說的,它主要解決的確實不是專業開發者的訴求,它解決的是那些原本就沒有辦法去用一個編輯器來換掉一些素材,然后達到他們的效果這樣的一群創作者。創作者的門檻有很多種,有些創作者他最后也變成了engineer。
我知道至少90%的創作者的核心,或者說他的偏好就不在于把這種東西實現出來,而是把他的腦洞更多的去放置到這個游戲里面。它就有點像你說的第一種,它會把資產給換掉,什么變成梅西跟C羅打在一起,類似于這樣一種形式,他已經很開心了。
我覺得就是剛剛你說的兩種,其實它多少都是有點針對于像是early-adopters,而不是最靠前的那部分的創作者。至于說他到底有沒有價值,我覺得它作為比如整活、惡搞,包括一些IP的二創,這些方面的話其實都是有價值的。
包括我們之前在做museland的時候,當時也發現有很多用戶喜歡拿別人的IP來做二創,賦予一個新的場景,賦予一個新的世界觀,然后在里邊就可以跟原來那個IP玩的很開心。
我的邏輯比較像,比如我現在有一個魂斗羅,那我把魂斗羅的那個主角換成,比如我喜歡的某個動畫片里面的角色,然后讓他去打打,是OK的。但是至于說他有多大的價值,我個人還是會認為他比較偏向于叫創作者自娛自樂的狀態,不太是一個有很強商業價值的事。
03.UGC社區的生長
筱寧:所以其實商業價值也可以往下探究一層,商業價值其實有3種方向,一個是to b的商業方向,第二個就是完全to c的,還有一個就是to D(developer)的。
如果我們不光考慮early-adopter,因為early-adopter他其實對于所有新鮮的事物都是有一定的好奇心,然后愿意去嘗試的。但它要變成一個真正意義上的產品,它到底是哪樣的機會呢?
少云:這個可能也是想要聊的一個比較大的一個話題,就是創作者生態,或者叫做UGC。它怎樣發展出來,怎樣變成一個生態,或者怎樣放大商業化的一個價值。
首先就剛才孫皓提到那一點,我可能再稍微量化一點。可能我們認同的一點是每個人都能去做一個flappy bird,但是最大問題是誰來玩?產能是過剩的。
Flappy bird的核心用剛才所謂vibe coding的那種方式,我把bird本身換成了很多種的樣子,有時候是一個bird,有時候是一個坦克,變成一個皮卡丘,變成一個奧特曼,但其實這個價值就比較有限。這種早期的噱頭型的價值很快就被消耗掉了。
我們可能看的是在這個過程中,在被消耗掉的過程中,一方面是有沒有人能夠去創造自己的IP,這個IP特別適合flappy bird這樣的一個交互形式。但這個比例是多少呢?可能1‰、1?,這是第一點。
第二點是假如這個噱頭是成立的,我吸引了非常多的人卷入進來,卷入進來之后UGC的整個創作者生態是怎樣發展起來的。我不太喜歡就所謂把to B、toC 、to D這樣的事情講的特別清楚。
我們回憶第一個接觸的UGC的游戲是什么,可能我能夠想到的是坦克大戰,還有就是摩托車,有一個摩托車手,然后在那邊它如果加速過猛的話,那個引擎還會過熱,它里面也可以自己去擺各種各樣的那種三角形的跳臺之類的,這樣的一個游戲。大家在玩那些,那你不就在生產關卡嗎?坦克大戰也是在做這些事情。
做這個事情的時候,你定義你是一個developer?是一個to b的事情?不是的,你就是一個玩家,你在參與這件事情,你覺得這個東西很好玩,然后你可能做的感覺還挺自豪的,而且我做的不錯,那我就分享給孫皓玩一下。我如果我覺得也沒啥,那可能我就自娛自樂一下就結束了。
我會覺得在UGC生態的最早期,B、C、D是不區分的。把這東西分出來的階段,其實是一個比較晚期的商業化成立的階段。在最早期的時候,其實就所謂BCD的這些東西,它是融合在一起的,就是創作即娛樂,創作即消費。
你在探究這個編輯器的邊界,你在想象這個編輯器它能夠做到什么事情,你在做這件事情的過程中,就比如像很多人在玩Minecraft這樣的游戲的時候,他在做什么?他在挑戰這個世界或者這個游戲的一些邊界。我看看他什么時候死機,我把整個世界塞滿TNT現在點爆,然后我的顯卡炸了,這個很好玩,他是在玩嗎?其實不是。
他在挑戰這些東西,但挑戰這些東西也是游戲的一種,它是最本質的游戲的一種,所以它也是一種體驗。
在看待這些的時候,這種所謂ugc最早期的時候,我比較希望就是說game vibe coding這件事情,它降低了很大的一個門檻,是不是能夠讓更多的人以玩樂的心態參與進來,然后去講一些我們從來沒聽過的提示詞,然后他也會給你一些你從來沒見過的反饋。
可能這里會開創出一些新的品類,新的賽道,或者新的所謂的游戲的交互形式、交互體驗。可能是只有1?或者10萬分之1,而且還需要那個人他非常的有興趣,他真的是個人興趣、個人體驗驅動的,他不一定是利益驅動,應該說他肯定不是利益驅動,因為一開始是沒有任何利益的
他就是個人興趣驅動,然后把這件事情會一直去做的深,他就創造出了一種游戲的品類。我們現在幾乎是所有看到最大的游戲品類,Moba、 FPS的吃雞等等,這些都是來自于mod。
那么早期它是一個怎樣的形態?它是基于說因為未來能賺大錢,所以我現在做是一個to b的事情嗎?不是,他就是一個愛好者,他就在那邊做,但是他堅持了很多年,他在上面一直去優化,一直的去改進,把這件事情做得越來越make sense。
當然到后面整個的發展,我相信超出當時所有人的想象,他會變得越來越大。他甚至還到了手機上面,他甚至還變成一個,各種各樣的衍生的生態都變成很大的生意,這是非常早期的一個東西。它應該是一個BCD捏在一起的狀態。
孫皓:感覺早期像那個魔獸爭霸的地圖編輯器,其實一出來的時候大家都在那兒玩。然后一開始的use case就是說我可能造一些特別奇怪的地圖,我就在水里邊出生之類的。但后來的話發現里邊有做3C的、包括后來的dota,都是從這樣的一種形態中慢慢演化出來的。
其實UGC的精髓確實來自于說1萬個或甚至10萬個這種UGC的創作者,最終會跑出來一兩個特別牛逼的品類。然后這些品類最后甚至吞掉了原來這個編輯器、原本的游戲自己的這個生態。
這個里邊比較重要的一點就是這個編輯器到底提供了多強的自由度。這個點是很重要的。我們還是會認為說vibe coding給提供的自由度還是很廣泛的。
只不過是今天,比如我形容自己的話,就覺得自己有點像那個早期玩魔獸爭霸的地圖編輯器,在那把十個房子給放到一起這樣的一個程度的一個創作者。
但真正要說非常厲害的創作者,當他看到vibe coding的能力以后,他會在上面去衍生出一些我們之前完全沒有想象過的一些方向。這個確實像少云剛剛說的這是一個非常早的階段。
這個階段可能會需要一方面是大模型能力的提升,然后另一方面的話是不斷的積累創作者,逐漸的在上面也會產生一些非常獨特的東西。
筱寧:在深入聊到UGC之前,因為你們倆剛才都提到了一個詞,也是AI時代大家經常提的一個詞,叫做AI降低了創作門檻。但我想把這個東西稍微再具象化去聊一下,就是所謂的降低門檻,剛才也提到說模型可能要等他再去更智能一些或者更強大一些。
降低的門檻到底是什么?就在創作游戲這件事情上面,什么門檻被降低了,什么東西其實并不是這一波AI帶來的門檻的降低?同時如果我們真的是在期待模型變得更加的強大,強大那部分又是什么?
孫皓:如果從純工程的角度來看這個問題的話,其實剛剛也提到過,我們整個計算機的發展。一開始的話是匯編,然后匯編后邊逐漸出現了C這種高級語言,然后C后來也不夠高級了,出現python,然后python不夠高級,出現了vibe coding。
所以基本上這是一個封裝的過程,你在不斷的去把一些更底層的,但是不需要上層去理解的這種概念,被上層的語言直接就內化掉了。
其實我們對大模型的未來的期望倒不是說就你PUA一下就夠了,而是說你有一個很清晰的自然語言的描述,它就可以被轉化成有效的、可以在計算機里跑的這樣的這么一套機制,然后它也可以被稱為一種語言。
這種語言的話,如果它強大到、簡單到普通的創作者本身,只要他腦洞夠深,他的這些腦洞都可以被執行下去,至少他的這種玩法都可以被實現出來,就基本達到了一個更高級的語言封裝這樣的一個目的,這是從大模型的角度。
但是它確實解決不了的幾個問題。比如像這種assets,尤其是3D下會有大量的問題。這些問題的話確實是因為現在包括pixso lab這種產品也出現,他在想辦法去解決比如說你的一張圖,做一些風格遷移,保證把你的圖像風格遷移到在同一個游戲里面,看起來是沒有違和感的這樣的一種工具。
這種工具的話它本身也可以作為一個MCP去用在跟大模型的游戲code生成的合作里面。所以它逐漸會形成一套生態,這種生態會輔助普通的創作者。你只要有想法,然后你有一些這種參考圖,就能做出來一個足夠好的這種還原。
要說什么東西不太行,就凡是一提到3D我覺得我就比較消極。因為我覺得當年自己作為一個人類,我在unity里面去調動作、調里面的模型的骨骼,這些事兒我作為一個人類用的很痛苦。
它又是一個非常不容易去被線性描述的這樣的一些資源。這些資源的話其實對于大模型來說,我覺得直到很后面以前都會是一個很大的問題。
想彌補這些問題的話,可能就會是有一些專門的工具。這些工具比如說很擅長做這個事情,它內部有一些不一定是用現在我們說的這種大模型的方式來去解決,但是它可能能輔助到大模型,就相當于把這部分的工作就外包給這些工具了,這樣的一個形式來解決。
少云:從另外一個角度,我看到的是,現在比如AI coding這件事情,他能夠一句話去做一個體驗。但是我可能非常習慣去思考,這個體驗能不能更久一點、游戲壽命能不能更長一點。
它僅僅是一個10秒鐘、15秒的東西,就算你做成一個橫版闖關跳躍,它的整個應該沒有超過五分鐘、十分鐘的,根本就談不上一個比如說2個小時、10個小時的一種make sense的體驗。
這一點上,有一點像比如說AI的聊天對話,包括大部分這種情感陪伴類的產品。最初在情感陪伴類里,我們看到一個很大的一個問題是,很多只能聊比如20輪或者最多半個小時,聊完之后其實就很無聊了。這還是等他生成的時間很久,如果能夠反饋的更快一點,其實根本聊不到半個小時。
現在vibe coding也有類似的問題,它生產出來的所有這種交互體驗就只有那么短,我們很希望它變得更久,但是在變得壽命更長的過程中,好像一下子就會觸及邊界。我不知道怎樣讓他變得更久,或者說我知道,但是我告訴他他做不到。
孫皓:這里邊比較大的一個原因是因為,首先大模型的context有限,然后現在的很多游戲開發的語言又不夠高度抽象,所以導致大模型在長context下很容易渙散,然后你又很難把它的上文,尤其游戲的機制非常復雜,可能還涉及到了很多的關卡設計,每個關卡里邊就有很多細節……
這些東西很難被壓縮到同一個上下文里邊,讓大模型可以長時間里都保持一致性,這是一個比較大的問題。
我倒也見到業界有一些比較新的想法,看怎么去設計一套更新的引擎。因為引擎這個東西本質上就是來做高度抽象,把一些更基本的,包括粒子渲染、包括物理引擎全都給封裝起來了,你不用再去關注它了。但是引擎目前的封裝還是不按照vibe coding的形式來做,所以有人去嘗試。
在Hugging Face上有一個項目叫vibe game。它的思路是這樣的,在抽象的角度來說,它會把什么物理、渲染這些機制全都抽象起來。就相當于你不用再去管理他們了。然后在語法上面來說,它用類似于那種ASML,跟HTML比較像的一種語法形式。
這種形式因為大模型以前已經看過很多次了,所以說再去掌握這種新的語言會很容易。然后第三個的話就是他會把實體和組件去拆分,保證在長期整個系統里邊一個模塊化比較有序的狀態。
很多這種基于vibe coding原生去嘗試做的新的引擎可能會帶來一些變化。會使得比如說context壓縮的很短,反過來說就相當于在context里面可以去容納下更多的信息。
信息量大了以后,它在繼續推理的時候,就更容易去跟原來的這種開發習慣,包括物料、游戲機制都能保持一致。這個我覺得是對于游戲的vibe coding來說是非常重要的。
筱寧:這里面有幾個點,一個是說他能去壓縮一些context,而大模型本身其實能夠去容納context的能力也是在提升的。包括可能在現在的發展過程當中,對于他的記憶的管理,本來也是一個在研究的、有進展的方向。
第二個就是,大模型之前他比較擅長處理一些線性context的關系。對于非線性的這些context,怎么樣做結構化的處理和管理,甚至再到生成,這可能又是另外一個需要去攻克的難點。可能這些都在解決的是,模型如何去拿到更多的、多維度的context,并且能夠去同時生成不同的模態。
少云:一個游戲的系統,一個成長的體系,或者一種比如說技能的體系,把這個東西拆開來,然后排列組合或者去推理。剛才這個結構會比現在的這種比較模糊的、給一個一句話的prompts就讓他去生成,會更加清晰。
筱寧:回過頭來我們還是聊回到UGC這里,因為這也是一個現在融資故事里面比較大的一個故事。但其實我們有時候聽到的這樣的一些故事會直接去到今天我們看到的,比如說roblox,但我覺得我更想回到最開始那個狀態。
剛才可能少云講的是一個最原點的狀態,但如果沿著這個原點再往上走,可能就是我們常說的0到1。對于一個UGC平臺來講,這個0到1到底要有哪些要素,或者他怎么成長起來?
少云:這個其實還挺難回答的一個問題,否則的話UGC品類可能就會變成一個比較模式化的存在。但是真正的UGC的游戲、UGC社區,其實說實話是非常少的。
我們自己早期會更加廣泛的去看UGC。比如說玩家在做創作的這件事情,那都是UGC。他是不是一定要在一個很原教旨主義的,比如說引擎上面或者說編輯器上面去做創作呢?還是說他在游戲里去做最簡單的,比如MMO里面都會有一個家園,或者生存類游戲你有個家,那現在給你一個沙發,給你一個床,你要擺一下,這就是UGC。
因為你會對這東西有個想象,所以你要造一個東西,這種UGC可能是比較粗淺一點,畢竟它提供的游戲內容是相對偏少的。可能你擺放完,看了一眼,內容就已經被消費了。
可能更進一步的UGC會變成什么?會變成比較像肉鴿類的游戲,你要去做一個build。所有的這種重度游戲,包括戰斗游戲、包括吃雞,你在單局里面做一個你的build,這種build本質上也是一種對戰斗的一個UGC,對角色的一個UGC。
當我們回到很原始的狀態,比如說在MMO里面每個人都有一個自己的avatar,這個avatar其實代表了你自己內心的隱秘的愿望,不一定在現實生活現實場景里會出來,但是在虛擬世界里面反而會更加的暴露。
那我在虛擬世界里面,我就要提供很多的元素,讓你可以把這些東西build出來。可能你穿的衣服、你選的門派職業、你是個男的女的,可能每一次我選的都是人妖號,就想要體驗不一樣的狀態,這都是一種UGC。
再到我們很原教旨主義說拿一個編輯器做一個游戲或者做一個關卡,這當然是很UGC。所有這些其實你都在生產一個內容,但這個內容不一定是給別人消費的。
絕大多數的剛才講的很多內容其實是給自己消費的,從來沒有想過這個內容要賣錢。只是說我因為游戲提供了這樣的自由度,所以我做了一個自我表達。
在這個過程中,UGC并不是今天突然出現。我們要想的是,玩家在一個虛擬世界里面,他的需求是什么?他是不是有未被滿足的一種需求或者一種體驗,這樣的一種體驗最后可以被UGC化,這可能是原點,再往下的部分可能就叫設計方法論的部分。
他需要有一群人,在一個很核心的、可能很tricky的一個體驗上面,大家一起在這里面去努力,然后我做一點東西給你看、你做一點東西給我看,這就是一個小小的UGC的一個原點。我們來想這件事情能不能放大。
筱寧:其實有點像不管是一個人、還是一小撮人,他的創作和消費是被揉在一起的。但是到今天其實比較成型的UGC的平臺,不管我們說的是抖音還是一個游戲,它的一個特點叫做我的創作和消費不一定是同一群人了。
有一些人已經變成了創作者,甚至是專業的創作者,大部分人其實在里面就是一個純消費了。這是他達成了一個叫做可商業化的UGC平臺的特點。
當然,你剛才講了一個叫做最早大家是為了熱愛,或者說因為喜歡玩聚在一起的。但是如果最終要發展成一個平臺,相當于有一些人能從這個環境當中能跑出來,變成一個頭部的創作者,首先是AI會讓這個路徑變得不一樣嗎?或者說傳統的路徑會是怎么樣過渡過來的,有什么樣的一些很重要的轉折點?
少云:首先剛才講的這樣的原點,可能存在在很多的、廣泛的興趣社區里。社區里面會有人、或者說人人都是創作者,人人都是消費者,是這樣的一個狀態。這些興趣社區假如有一個東西,可能在某種機緣巧合之下,他出圈了,或者被放大了,或者被發現了,那這個東西會變得更厲害一些。
這時候走上的一個道路,通常可能我會分成叫三個階段,第一個還是一個成長的階段,第二個是叫做成熟的階段,第三個可能是運營的階段,當然運營也是貫穿始終的。
假如一開始我們就要做這件事情,其實一開始就要用運營的力量去介入。那在一開始的、還是興趣驅動的階段,在沒有利益和商業化參與的時候,大家比拼的是什么東西呢?好像有時候是一種尊重的東西。這種環境最多的其實是大學校園。
大學校園沒有生活壓力,不需要賺錢,所以它一切的東西是基于叫做某種智力比拼:我很厲害,我做了一個產品,我做了一個游戲。所以大學里面會有很多非利益驅動的創作者。這件事情如果被驅動起來,其實就已經具有能夠去消費的一個基礎群體了。
第二步其實是比較難的那個部分,看的是你的創作者是不是足夠多?當足夠多的時候,還要保證這些人能有持續的創作動力,因為大學的話一旦畢業了,他就不創作了,他就有現實的社會的生活壓力就來了,但這個社區它是一個興趣社區,它完全沒有商業化,它無法供給我的這種收入。
所以這時候,現在這個時代比較好的就是有抖音、快手、小紅書這樣的社媒平臺,信息平權的平臺,所有這些創作者可以把他的東西放到這些平臺上面,叫做羊毛出在豬身上。
在另外一個地方,完成我的價值閉環,他不一定是我做了這個游戲,這個游戲要賣上錢我才有收入;我做了UGC的內容,發到了小紅書之后,小紅書看的人很多,然后我去做直播,我最后賣個貨,可能也是一種方式。
最后他會在這些社媒平臺上完成價值閉環,在那里達成了商業化結果。但這一點就比較困難,因為需要這個人要非常的厲害,對創作者要求非常高。我們從實操角度,我覺得可能是1?的人。
所以你首先你得有1萬個的創作者,而且是有持續創作意愿的人,這樣的冷啟動其實還是有規模的門檻存在的。
包括這些創作者在這個平臺上面,他持續不斷的產出內容,在產出內容的過程中,他一定會遇到瓶頸,他遇到瓶頸是你提供的編輯器能夠做的邊界。這時候你作為編輯器的運營和開發者,你就要給他提供新的內容,拓展他的邊界。
但是這時候就有個悖論,就是這個邊界越拓越寬的時候,你的創作者的來源門檻會變得越來越高,你的來源會收束,愿意來做的人會越來越少。
抖音也是這樣,所有的UGC平臺都會經歷這樣的一個階段,就是有一群人賺到了錢,他因為把他賺到的錢再投入到他的內容生產里,他成為了PGC的、專業的開發者,他能夠自負盈虧了。
這時候他就會提高內容的上限,他會倒逼平臺去提供更強力的工具給他,甚至會自己去生產這樣的工具。
這種降維打擊形成之后,比如說現在我們自己要去抖音起個號,白手起家,從零開始,說我現在要拍短視頻,這個門檻可想而知。所以這時候就分化了,就像剛才筱寧說的,叫做創作者之間的有人賺到錢,有人沒賺到錢,卷成功的人在那邊越做越大,就來到了最后的運營階段。
運營階段其實要講的是平臺和創作者之間的某種關系。你不能讓創作者去壟斷平臺的話語權,平臺還是要保留自己最終的選擇的權利。對于創作者來講,還是相對比較短視的;平臺對價值會看的非常的長遠,平臺上的內容豐富度如果是收斂的,最后對平臺生態一定是不利的。
所以我需要去打開整個信息繭房,需要去做流量分配、流量管控,有我的價值觀需要輸入。包括對于創作者生態的平衡,新增的創作者在哪里挖掘,老創作者的利益怎么平衡,這時候就全部是運營的工作。
筱寧:這里面有兩個地方是我比較好奇的。第一個就是因為頭部創作者這個比例就是很低的,就是一個1?的比例。那先有1萬個人這件事情,是不是AI來了就變得容易了呢?
少云:我感覺還是會容易一些,畢竟像剛才孫皓講的,其實這波噱頭它會吸引到很多人。但我不太清楚,因為我只是很淺的去用,但像孫皓可能在搭整個vibe coding的時候,其實有搭建整個環境,現在這兩種之間會有個門檻上的一個區別嗎?
孫皓:我覺得區別還挺大的。首先外邊套了一層IDE的殼子,那基本上普通的創作者應該是不會去用的,實話說這個東西一看就是個工程軟件。本身沒有很明確的工程經驗、或者說沒有在互聯網行業做過的人,他應該是不會去掏出一個cursor去狂寫代碼的。這也是為什么Lovable這樣的公司會出現,它給了原本不去用IDE的人一個機會,這是很關鍵的一個事情。
其次的話,我會比較傾向于認為,最終光靠文字的交互可能不是最好的形式。現在從整個大模型的應用的角度來說,還沒有找到一個特別適合大模型去工作,并且人類也覺得舒服的一個UX的形式。
但是至少我們知道IDE對于普通的創作者來說肯定不是好事。其他的這種各種形式,就得看到底誰能最好的找到創作者原本認為最舒服、然后需要改動的次數最少、又能夠去準確表達他的意圖的這樣一種形式。
少云:換一個角度,比如像這樣的編輯器,你認為它最后是大一統的,還是說他會在方向上更加的專業化?
我隨便舉一個例子,就比如說像捏咔,一個OC的社區,如果對它用AI進行改造,那我就需要有它的所有的context,然后把它全部輸入進來,讓它的效果更好,讓它的OC的表達可能更準確,更生動之類的。這是一個非常專用化的一個編輯器。那編輯器最后變成UE,就是通用化的引擎。我不太清楚在這個上面再往前走一下,它是一個更專業化還是一個更泛的一個方向?
孫皓:我覺得從UGC視角來說的話,專業化和泛化的兩種編輯方式肯定是都存在的。包括今天你也可以掏出抖音直接錄一段,也是個視頻;但是你拿剪映,甚至比剪映更復雜的一些工具,10個小時做出來的這種很精細的視頻,你會發現都是視頻,但是大家差別很大。
未來我覺得也差不多,肯定會有一幫人在做的是你有一個idea可以快速的生成出來,這肯定是一種形態;但是對于每一個獨特方向想要做出很強的商業性的內容,我覺得還是需要有很專業的這種工具在后面支撐的。
筱寧:回過頭來,剛才聊到UGC應該算成長期。在傳統的一些UGC的平臺上,我們最極端一點,拿抖音舉例子,我什么樣的人能在平臺上跑出來,我覺得其實是有三類。第一個叫做我有這個技術,你沒有。可能到游戲里面就是我能寫出來這個代碼,你寫不出來,這是一種。
第二種叫做審美上的,這個也是通用的,可能就是做出來的東西大家就是很欣賞。
第三種其實是時間上的,抖音上經常會有一個類型的視頻,去說這是耗時多少時間,幾百個小時做出來的,那可能放到游戲里面,比如說我拿Minecraft去還原了一下我在的這個地方,可能我是花100小時搭出來的。所以其實是有時間、包括審美、包括技術三重東西來構成這種差異化。
但如果AI來了以后,首先我不用去搭樂高了,我說我要一個東方明珠,他就給我生成了,那時間這個成分就減少了。第二個,你說技術,如果大家都是通過vibe coding的方式,或者說我讓AI干活的方式,好像你能做的我也能做了。
那是只剩審美了嗎?或者說如果在一個AI的這種UGC的社區里面,我不管他是不是游戲,頭部創作者靠什么跑出來?
少云:我是這么看的,就是說剛才講到了三個階段。在第一個階段里面,其實有一個點沒有很細的去講,就是編輯器不應該太強。說白了就是最強的游戲編輯器,可能游戲引擎unreal已經在了,你為什么不用呢?因為它門檻非常的高。
它的確是最強的,但是并沒有那么多人會去用它。所以一開始并不應該做功能那么強大一個東西,其實說門檻那么復雜的東西,反而他應該把門檻降低。門檻降低就意味著我能容納的創作者的數量是變多的。為什么這些創作者都要來?他一定有一個共性,這個共性的門檻越低越好,這個共性就是他們都很有空,他們都不要錢,這就是最低的門檻。
所以剛才提到在大學里面的人就往往會有這樣的興趣社區,因為很有空又不要錢,所以我就在這里做這些事情。一旦門檻加上來之后,這里就有一個悖論,生產力的提升或者功能的強大,是不是會對這件事情是個好事?
先不說vibe coding,就AIGC(文生圖),現在是不是已經足夠成熟了,但還是有強有弱的。這里面還是有會有門檻,vibe coding只會把這個差異變得更大,這是第一個。第二個是我生成出來的東西,有時候在一些專用領域,它會有比較專業化的一種用法,比如vibecoding在一些單一品類會有更專業的用法。
再回過頭來說,UGC發展的早期,編輯器不應該是一個特別復雜的東西,而是應該讓人看到有興趣去用,這比你的功能強大與否要重要的多得多。加新功能的時候,特別是AI類的功能的時候,是要非常的謹慎。因為一旦你加進去,你就要想象到你的所有的創作者的基礎里面,90%那些最有空、但是其實可能沒那么有創作能力或者有技術水平的人,就被你這一個東西給淘汰掉了。
我們稱之為電子十字繡。有很多人其實電子十字繡在上面就是一個像素一個像素去做,這件事情看起來好像在浪費時間,但不是的,大家對于這件事情會說你好厲害,你就能把東方明珠這么一個像素搭起來,大家看到的是工作量,這件事情在東亞特別被買單。
筱寧:當時你們做museland的時候,也會有這種電子十字繡的現象嗎?
孫皓:有的。你會發現有一些用戶他會像寫小說一樣,把人物背景信息給寫到上千字,很多東西他都要精心的雕琢,甚至這里邊有一些不是我能看得懂的語言,還有很多黑話在里邊。然后這個會作為他們的作品,他們也管這個東西叫做他們自己的崽,把它作為自己的一種資產去看待。
還有一種就是從消費的角度來說也是一樣的,當你發現一個用戶跟AI的角色去聊了幾百輪,你會發現他正在嘗試把這個角色塑造成一個他想要的樣子。
我們也見過一些比如海外的大齡家庭主婦,他沒什么事兒干,他就喜歡去把我們平臺上每一個霸凌的角色全給勸誡成好人。類似這種就是他會有大量的時間,然后他拿這個時間做的事就是他要凈化這個平臺。
其實類似的像minecraft上面就有人在搭了一個神經網絡,也是個老外干的。
少云:我記得最近MC還有一個新聞,有個人在正常的模式里面一直往邊界走,走了十幾年,然后現在終于抵達了邊界。其實如果開創造模式,一下子輸坐標就到了,但他就要自己走,走到那個地方。
筱寧:一句話生成游戲會不會就剝奪了這種行為藝術?
孫皓:也不一定,比如現在vibe coding做游戲,做個泡泡龍,它做出來東西挺一般的,但是一定存在某種野生大神可以通過這個方式把泡泡龍給做到一個像3A游戲的水平,我是相信有這種人存在的,他可以在這個過程中把prompt能力搞到極致,我覺得在AI所帶來的這種自由度上,還是能夠去產生足夠多的差異化。
上一代做視頻的,用midjourney和Vidu做出來的視頻已經很驚艷了,你可以說sora2出來之后,他之前的功夫可能無效了,但至少在當時看來,很難想象一個普通人到底花了多少精力,才能把一個兩分鐘的視頻迭代到那個程度。對努力的這種贊賞也好,還是對工藝技藝上的這種贊賞,我覺得在AI時代還是挺常見的。
筱寧:所以我就在想,其實大家追求并不是說更短平快的一句話生成,而是在這樣的一個平臺上,或者在這樣的一個工具下,能夠通過一些方式實現我之前實現不了的東西。可能是不是這樣的東西會更傾向于被鼓勵?
少云:對我覺得肯定還是結果導向的。生產過程如果你只是自娛自樂的,那只是我們基于UGC早期形態來講,你在走出校園以后,你一定要直面社會的考驗,直面商業化的評判。
一旦我們進入到所謂第二個這種商業化評判的時候,就是結果導向的,這個結果能被多少人看到,能影響到多少人,能賣多少錢,本質上還是這些事情,但這些事情他不一定只有一種方向,它可能有很多種方向。
那vibe coding是不是能讓這種方向更快的去實現出來,可能在加速,但最后跑出來的那些人我覺得其實還是超級個體,還是那些真的或者非常有taste,或者非常有創意,或者非常有堅持的,只是堅持的東西跟原來不一樣了,他不能去卷電子十字繡了,他就卷另外一個可能很行為藝術的事情,最終還是最極致的人,超級個體,他被卷出來以后,接受商業化的一個判斷,大家來用腳投票,用注意力來投票。
筱寧:如果在0-1的時候,大家的聚合是因為熱愛、因為興趣、因為有時間,工具(編輯器)又不能做的太復雜,其中也不牽扯到錢,那么,不同游戲社區之間的壁壘到底是什么呢?
少云:對于社區的評判肯定還是結果導向的,什么是好的社區?能永續的社區就是好的社區。那怎么能讓它永續?其實還是把握剛才的那個度:我要提供功能,但又不能一下子把功能拔的太高,讓上面的人走的太快,因為人的差異很大。到了尖端的人,會有壟斷的沖動,會希望利益最大化,在利益最大化的過程中,他會把下面的人干掉。
平臺要做的就是去平衡這樣的力量,不能讓頭部壟斷,要讓頭部輪換、并不斷發掘新的創作者,去保護他們、補貼他們,無論在流量還是錢上,甚至還要培訓他們,在這上面做大量的投入,才能讓生態保持一個健康狀態。
如果我們作為運營者,在早期其實手里沒有那么多的工具,中期商業化如果能轉起來的時候,手里其實會有很多的資源和工具。這個工具最后是基于你的價值觀去使用的,那我們的價值觀還是希望社區能夠永續,盡可能長的去運營。
筱寧:我想到一個比較好的例子,雖然不是游戲的,就是淘寶當年的直播電商和今天抖音直播的對比,其實就有點像剛才說的那個形態。一個活的生,就是我這個生態里面還得有一些流動性,但其實這件事情反而對于創作者來講壓力是非常大的
少云:這個的確是這樣,但是隨著平臺的成長,創作者其實也有了一個更大的一個平臺,更大的一個成長。但壓力的確在那邊,你要跟上這個平臺成長的速度,很多人可能跟不上了。
筱寧:剛才聽這個描述就會覺得,之前我們講所謂的AI UGC社區的時候,大家更多去關注的還是技術的部分和產品的部分,但好像在這樣的一個成長鏈路里面,變成運營的部分可能反而特別重要.
少云:在你沒有各種資源的時候,其實就特別吃運營,最后面當然是運營,但那個時候是制度化的運營。在最早的發展階段,對運營而言,可能情緒價值也很重要,你跟創作者就是生活在一起,你也了解、或者說你本身就是這個創作的團體的一員,否則你怎么想到要做這個東西呢?
你了解需求,只是現在更有能力、或者現在有資源,把這個事情做得更好,讓這個社區變得更大或者更厲害,去滿足大家。
04. 創業者的機會
筱寧:問一個比較VC的問題,我們現在在聊的是大家會去相信有AI時代的roblox嗎?
少云:Roblox本身一定已經在做大量的AI vibe coding化的一個改造了。這個還是回到前面播客也講過,就是我認為會有AI native的平臺的機會。
但是它核心在于就這件事情真正帶來的價值在哪里。它如果跟現在的那個價值是重疊的,可能就沒必要,或者現有的平臺他就能做。核心在于那個價值原點現在在哪里,至少在AI game vibe coding上面,其實我會看見的這個價值原點現在不是特別的強。
孫皓:我比較認同的就是,如果原來的能力上已經能做出來,現在把它增效十倍,這件事兒對于創作者來說其實價值沒那么大,優秀的作品其實最后還是那些。頭部作品占據了絕大部分的attention,那些沒什么用的作品,雖然你可以更快的做出來,但也沒什么用。
roblox現在雖然在做很強的vibe coding適配,但最后在平臺上沉淀下來的游戲,可能還是那些。如果想找到一個AI時代的roblox,要考慮到底哪些是他現在做不好的事,而vibe coding更容易做好的。
少云:剛才一開始也留了個坑,就是靈光,靈光其實給到一個很大的啟發,并不是在vibe coding的能力上,是他vibe coding之后,可以變成一個鏈接分享給他人,這件事情一下就拓展了一個維度。
原來是我一個人在編一個坦克大戰的關卡,現在我們兩個人一起來,你先編輯一下,然后我拿過來再編輯一下,我們變成兩個分支,還會分享給其他人,其他人繼續在分支上面再分支,或者繼續去深化開發。這件事情就特別像剛才講的早期社區,我不知道靈光會怎么去做這件事,但這件事情已經有這樣的原型了。
如果作為運營方的話,其實可以看到所有的vibe coding里面,這些分支里面被改動次數最多、傳播最多的、玩的最多的是什么。篩選出這樣的原型后,可以去做運營導向甚至到商業化閉環的事情。
筱寧:剛才的描述特別像升級版的github,門檻低很多的github。剛才描述的場景里面還想到一點,因為現在比如我們在rosebud上面做remix,還是一個中心化的過程,它沒有一個共創和接力的過程。
少云:現在就更像是一個去中心化的一個平臺,如果像傳統的,還是要去找一個原型,在原型上面改,我覺得太重了。
游戲本身就來自于社交關系,它使得我們剛才講的一句話生成游戲種,給那“一句話”賦予了意義。這個意義是什么?是這句話是誰給你的?這句話是誰說的?它的意義來自于發給你的那個人,你會覺得那個人怎么是這么想的?怎么有人會想做一個什么這樣題材的東西,好奇怪。可能我基于我的taste我就會加兩句話進去,然后我再問回去,這之中產生了一定的社交關系。
它是基于社交的一種自我展現,但又不是那么直白的說“我是一個怎樣的人”,它是一個創作過程,一個可交互的組件。我說的稍微抽象一點,有點像我給你做一個測試,“我有20個問題你能不能回答上來”,是一種不那么生硬的社交感覺。
這是一個游戲,這個游戲就是我做出來的,我做給朋友的,讓你更了解我了,然后你也做一做,你也弄兩下,然后又發給另外一個人,他也更了解了,他會變成這樣一個挺奇妙的感覺。但這件事情要運營好可能更難了。
孫皓:他分享給別人的時候,會把我的創作過程也分享過去嗎?
少云:分享的過程其實是相互能看見對方的prompts。原來我們會覺得這句話其實很無聊,也就20個字,但是現在因為是來自于誰,來自于一個跟你是有關系的人,當然關系有親密有遠有近,這句話就賦予了意義。然后我再回一句話,這句話又有了另外一個表現,疊加在這個小游戲上面,又傳回去再擴散出去。
孫皓:產生了一個基于社交關系做出來一個最終的結果。這個結果上面能看到整個流程中,大家每個人是在上面怎么去思考的,這個很有意思。
少云:可能也不一定是結果,我覺得結果都不一定重要,這個過程對這個小團體,這個社交關系來講是非常重要的。
筱寧:怎么感覺這個過程其實很像一個簡化版的跑團,就大家共創的不是一個故事,但共創的是一個交互的體驗,一個小游戲。
從另一個角度提到靈光,就會覺得因為靈光也是一個大廠的產品,就會回到那個永恒的話題,在這樣的一個敘事面前,創業者的機會在哪兒?
其實在海外所謂的AI應用創業會有一句話叫做,離模型能做的能力稍微遠一點,遠多少大家都有自己的說辭。但你會發現在國內這個問題好像變得更加的有挑戰性,因為大廠不僅擁有模型的能力,大廠也具備所有分發的能力,就他全在他手里,那在這個時候創業者的機會會在哪兒?
少云:我覺得其實回到剛才你提的那三個價值,時間可能在這里就不成為很強的一個競爭優勢。但是taste,特別是在垂類里面的專業知識,可能還是有價值的。這個東西可能至少在早期,它不是一個平臺級的機會。
但是在早期的話,你的切入點,你要做很多像剛才說的資產對齊的工作,這樣的一些dirty work,這些事情現在至少在大廠角度,他不會很在意,這個就是早期創業者一個切入點。
我就是對這個引擎或者這個興趣社區,它是一個很小眾的興趣社區,我特別專業,我對這個引擎我比較熟,然后我現在做一些這種資產對齊,把開發流程打通的工作。先不要一上來說我現在要顛覆整個社交關系,社交平臺,這可能比較困難一點
孫皓:我感覺差不多。總的來說的話就是我們會比較看重的是dirty work。具體的形態比如說gemini、claude、openAI互相競爭,中間可能有的時候也會做做PPT,claude也會做做用戶研究,openAI會去做會陪伴。
但當他們真的競爭激烈的時候,他們會把所有的資源投在哪里呢?還是會放在基礎模型能力上。比如gemini3.0上線以后,Sam Altman的第一反應就是要把5.1升級成5.2,其他的資源都可以停掉。
我們要找的方向就是這種,有可能大廠甚至涉及過的,但大廠一定不會作為戰略上非常重視的地方去深挖的方向。這個深挖的結果會造出一大堆的dirty work,包括對行業的認知、一些很重要的能力。
這些積累起來以后,你就會有一個你足夠臟,大廠覺得跟你搞得一樣臟也不一定有你搞得好的這樣的一個生態位,這個生態位對小公司來說就活下來了。
其次的話,大家老生常談一個詞叫“native”。這個詞針對的不一定是大廠,針對的是原來的行業占有者。行業占有者一般做AI轉型的時候,他的主要思維還是說我盡量把我原來的這套商業邏輯能夠盡可能的拿AI來提效,但其實他們一般所看不到的機會是AI可以完全顛覆他原來的這套商業邏輯的東西。
這個就要看創業者能不能從原本的一些很垂的行業,這些行業可能沒趕上AI這個時代,甚至還沒趕上互聯網。他們在這猛追的時候,他們往往所看不見的這些東西。
筱寧:AI的這一波應用創業里面,我自己印象最深刻的產品是Grammarly,因為你會覺得這個是最不make sense的,是模型應該具備的能力,但它居然活了下來,還活的挺好。我覺得它給我的啟發是,它抓住了足夠多的context。
并不是能力本身的差異,而是如果這個能力已經嵌入到了比如gmail里面、我的文檔里面,我直接可以調用,這本來也是一種價值,是來自于context的價值。
可能有點像你說的第一個情形,這也是一種dirtywork,它通過一定程度的做好了context和能力的捆綁,把產品嵌入到了實際的應用場景中,也是一種有趣的方式。
包括關于native,這個我覺得在游戲這個場景里面也很契合。就像今天我們看到所有的游戲大廠去做一些AI的東西,可能還是說在一個原有的里面去加一個AI然后看到他有一些什么樣的營銷噱頭。但是如果特別原生的,可能就是小廠愿意去探索的一種方向。
少云:在這個上面我稍微補充一點,就是剛才我們都在講靈光是大廠,但靈光其實在社交領域和游戲上他不是大廠。但反而他做出了在這個似乎現在讓人非常眼前一亮的一個東西。
而且因為他的這個傳播性非常的強,現在已經有一定的限制,這只是早期。他后續的這種運營的方式,或者如何去放大它的價值,承接它的價值,延續它的價值,再放大它的價值,這件事情可能還是需要一個做法。
筱寧:之前看公眾號文章,最近也被討論很多的一個人,姚順雨也說過一個點,他說創業公司最大的機會在于設計不同的交互方式,這件事在游戲的場景下成立嗎?
少云:其實一開始講的就是所謂叫交互的一個嵌入程度,就剛剛說的那根軸,就是從非常被動的到需要玩家全神貫注,高度注意力去進行交互的。可能我是從一個更抽象的維度,就是叫玩家沉浸感的這樣的一個維度去看待這個問題。
交互形式只是基于說如何去滿足當前我在這個維度標尺上的那個點。游戲本來就在做這個事情,好像一開始也聊過這個話題,就是游戲有一些長時反饋的,延時反饋的東西,后勁很足,它需要一些長期的投入積累,可能到未來的某一點延遲滿足的這樣的一些點,這是游戲可以帶來的體驗,很多其他的交互形式會有點困難。
筱寧:最后,推薦2-3款你們最近在玩的游戲吧
孫皓:推薦又不那么推薦的兩個游戲:《文明7》、《永恒之塔2》
少云:推薦的游戲:《球比倫戰記》、《Dispatch》
游戲葡萄招聘內容編輯,
游戲行業書籍推薦: 葡萄書房
(星標可第一時間收到推送和完整封面)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.