![]()
文:王智遠(yuǎn) | ID:Z201440
今天不國慶節(jié)嗎?
本來想著放松放松,結(jié)果,昨天晚上喝了點(diǎn)兒,差點(diǎn)沒爬起來。可偏偏在半夜,OpenAI發(fā)了 Sora 2。那會(huì)兒我真沒狀態(tài)體驗(yàn),拖到早上八點(diǎn),打開試了試。
怎么說呢?就那樣。
然后,10點(diǎn)左右,邀請碼就被瘋傳了。朋友圈、群里到處在要碼,像新款球鞋發(fā)售一樣。
我還在群里和朋友吐槽:一個(gè)生成式 App,博主們怎么就這么愛吹?要我說,Sora 2 真正值得關(guān)注的,是它背后的打法。
你想,Sam做一個(gè)產(chǎn)品,不光能用好海外媒體,還能讓國內(nèi)媒體、博主為它免費(fèi)宣傳,是邀請碼的問題嗎?不是。
說到底,這背后有一整套戰(zhàn)略打法。
01
什么打法呢?我要先提一個(gè)詞:臨界點(diǎn)。啥意思呢?
OpenAI 從來不搶早,它的習(xí)慣是:等到技術(shù)跨過可用閾值、場景被教育成熟,才會(huì)一擊入場。所以,它很看重臨界點(diǎn)。
那這個(gè)臨界點(diǎn)到底在哪里?首先,是技術(shù)。
Sora 1 剛出來時(shí),確實(shí)震撼了一下,但那更像「實(shí)驗(yàn)室里的特效」。你看它生成的視頻,畫面是美,但物理規(guī)律經(jīng)常崩。
人物走路時(shí)腳滑、東西拿不穩(wěn)、動(dòng)作不連貫;還有音畫不同步,嘴型和聲音對不上;說白了,Sora 1 是炫技,能讓人驚嘆,但沒法真正拿來用。
Sora 2 的出現(xiàn),必須要解決這個(gè)問題。
可怎么解決呢?Sam 肯定也在想,如果單純靠技術(shù)迭代,很難。領(lǐng)先半步的優(yōu)勢,很快就會(huì)被追平。真正的答案只有一個(gè):數(shù)據(jù),用數(shù)據(jù)反哺。
問題是怎么搞數(shù)據(jù)?
靠買,買不到;靠合作,太慢。唯一的解法:讓用戶自己生產(chǎn)。
這就是 Sora App 出場的意義。用戶在里面生成視頻、分享視頻、互相「客串」視頻,所有的數(shù)據(jù)都會(huì)回流。每一條操作,都是一筆訓(xùn)練樣本;每一次社交裂變,都是一次數(shù)據(jù)擴(kuò)張。
這和 GPT-3 與 ChatGPT 的關(guān)系一模一樣。
當(dāng)年GPT-3 在研究圈已經(jīng)很驚艷了,可真正在大眾層面引爆的,是 ChatGPT 的應(yīng)用程序。因?yàn)樗邕^了「可用性閾值」,成了一個(gè)人人都能上手的產(chǎn)品。
Sora 2,也正好走到這個(gè)節(jié)點(diǎn)。所以,Sora 2 為什么在這個(gè)時(shí)候發(fā)布?
技術(shù)上,它終于穩(wěn)到能讓用戶愿意玩下去;數(shù)據(jù)上,它通過 App 把用戶綁進(jìn)來,順帶解決了最棘手的訓(xùn)練樣本問題。
說完技術(shù),我們再看看看市場,過去兩年,Runway、Pika、Veo3,都在瘋狂演示 AI 視頻。
說句不好聽的話,他們在給 OpenAI 打前站,幫忙教育市場。以前用戶的心態(tài):AI 能不能做視頻?現(xiàn)在用戶已經(jīng)知道 AI 可以做了,問題變成:誰做得更順手、更穩(wěn)定?
這個(gè)變化很重要。
教育市場的成本已經(jīng)有人替你扛過了,你出手時(shí),就不用再去解釋「AI 視頻是什么」,直接說「我們做得最好」。就可以了。
這樣,投入的每一分傳播,都能換來實(shí)打?qū)嵉年P(guān)注度和用戶興趣。
就像電動(dòng)車市場,早年比亞迪、日產(chǎn)先推出電動(dòng)車,證明了電車能跑;可真正讓市場沸騰的,是特斯拉 Model S,因?yàn)樗怀鰣鼍妥尨蠹矣X得:
電車不僅能跑,還可以很酷,很順手。Sora 2 出手的時(shí)機(jī),就是類似的節(jié)點(diǎn)。
最后是戰(zhàn)略上的考慮,我認(rèn)為Sam的邏輯是不做半成品,不推半成熟的東西。Timing 勝過一切。
什么是Timing?
出手時(shí)機(jī)點(diǎn)。太早,會(huì)把半成品推給用戶,砸了口碑;太晚,風(fēng)口被別人截走,剛剛好,才符合他的風(fēng)格;所以,Sora 2 的發(fā)布,踩在了「技術(shù)臨界點(diǎn) + 數(shù)據(jù)臨界點(diǎn) + 市場臨界點(diǎn)」疊加的時(shí)刻。
02
既然 timing 這么關(guān)鍵,那他為什么要做成一個(gè)App?除了數(shù)據(jù),還要什么?
智遠(yuǎn)認(rèn)為是:工作流。
想象一下,如果 Sora 是一個(gè)模型接口,用戶得先寫提示詞,再導(dǎo)出視頻,再去別的平臺(tái)編輯、分享、加字幕。流程復(fù)雜,環(huán)節(jié)一多,體驗(yàn)就斷了鏈。換句話說,你用它的次數(shù)越多,就越想逃。
一旦把它做成 App,這些動(dòng)作就能被打包在同一個(gè)工作流里:
生成 → 編輯 → 分享 → 傳播,全都不出這個(gè) App,那你的視頻不是「生成完就結(jié)束」,而是直接帶著社交和分發(fā)的屬性。
長期下來,你習(xí)慣了在這里做內(nèi)容,就很難遷移到別的工具。
這就是工作流鎖定。對 OpenAI 來說,技術(shù)是敲門磚,真正能留下用戶的,是這種「一站式」體驗(yàn)。
我還體驗(yàn)了一下,讓Sam給我說相聲,梗是他踩了一坨屎。重點(diǎn)不在視頻內(nèi)容本身,是后續(xù)操作:我能直接下載下來,發(fā)到別的平臺(tái),甚至還能再優(yōu)化。
這就是基礎(chǔ)工作流的力量。
你看 ChatGPT。一開始大家都瘋狂發(fā)模型時(shí),為什么大家還用GPT,因?yàn)樗樖郑瑢戉]件、查代碼、寫文案,都能搞定。
Sora 的邏輯完全一樣。單靠模型,用戶永遠(yuǎn)會(huì)追著「誰家更好用」跑。但一旦被工作流綁定,競爭邏輯就變了:用戶要「最順手」和「最低切換成本」。
還有一點(diǎn),智遠(yuǎn)認(rèn)為,Sora App 里的「客串」功能,可能會(huì)是未來的殺手锏。
為什么?
你拍一條視頻,把朋友拉進(jìn)來客串,他就被迫下載、注冊、體驗(yàn),再順手轉(zhuǎn)發(fā)一下。視頻創(chuàng)作這事兒,本來是單機(jī)模式,但一旦加上「客串」,立刻就有了社交鏈,就變成了大家一起玩了。
這背后的邏輯特別像當(dāng)年的短視頻裂變:
抖音為什么火?因?yàn)椴还馐撬⒁曨l,還有你可以和別人合拍、對口型、二創(chuàng)。一個(gè)人用還行,十個(gè)人互相拉進(jìn)來,傳播就指數(shù)級放大了。
所以,Sora App 的思路很清晰:工作流鎖定 + 社交裂變。前者保證用戶不流失,后者保證傳播能快速擴(kuò)張,這樣,就成了又一個(gè)入口級產(chǎn)品了。
03
有了入口,他還想干什么呢?智遠(yuǎn)認(rèn)為是:生態(tài)。
怎么理解這個(gè)生態(tài)呢?
我特意查了下,Sora 2背后用了Diffusion Transformer的架構(gòu)。說白了,把原來做圖的「擴(kuò)散模型」,和現(xiàn)在大模型常見的「Transformer」結(jié)合在一起。
擴(kuò)散模型擅長細(xì)節(jié)、紋理,Transformer 擅長理解語義、控制整體場景,兩個(gè)合起來,就能保證畫面和故事的合理性了。
換句話說,Sora 2 在單點(diǎn)突破上,用了一整套組合拳,那以后會(huì)不會(huì)基于數(shù)據(jù)在推出新模型呢?我認(rèn)為,肯定會(huì)的。
因?yàn)槟憧矗还芄雀璧?Veo3,還是 Runway、Pika,這些產(chǎn)品背后,本質(zhì)上還在卷「模型本身」。
說白了,大家還在比誰的畫質(zhì)更高、不卡幀、動(dòng)作更自然。結(jié)果,這季度你領(lǐng)先一點(diǎn),下季度別人又追上來,永遠(yuǎn)是拉鋸戰(zhàn)。
但 OpenAI 的思路不一樣。
它當(dāng)然也在打磨模型,但更在乎:怎么把模型和產(chǎn)品綁在一起,再用用戶數(shù)據(jù)反哺模型。這樣一來,哪怕模型暫時(shí)不領(lǐng)先,對手也很難把用戶搶走。
等到一個(gè)個(gè)新模型出來時(shí),那下一步做什么?
開放API,給其他產(chǎn)品使用,這樣,Sora 2成了一個(gè)能力模塊,能嵌入到無數(shù)場景里。
比如說:
教育平臺(tái)要做課件,直接生成講解視頻;游戲廠商要做劇情過場,幾分鐘就能生成一條;電商要投廣告,一條短視頻廣告可以一鍵出爐。
所以,API 的好處是能讓外部開發(fā)者幫它「打天下」,幫忙把模型帶到各種場景;但只靠 API 還不夠。API 就像水電,別人接走用完就走,留不住人。
怎么辦?
答案是:要有自己的產(chǎn)品矩陣。ChatGPT 鎖定對話,Sora 鎖定視頻,這些入口一旦拼在一起,就成了一個(gè)逐漸成型的生態(tài)。
這條路徑,和互聯(lián)網(wǎng)巨頭的成長史特別像。
Google 當(dāng)年從搜索起家,但沒停在搜索。它順手做了 Gmail,進(jìn)一步綁定用戶;再做 Android,把移動(dòng)端生態(tài)徹底鎖死;最后,形成了一個(gè)全鏈條的應(yīng)用帝國。
蘋果也是一樣,iPhone 單點(diǎn)突破,但真正的護(hù)城河,是 App Store 和整個(gè) iOS 生態(tài)。
OpenAI 也是。智遠(yuǎn)認(rèn)為,它的打法用一句話總結(jié)即:技術(shù)敲門,產(chǎn)品收口,生態(tài)吃干抹凈。
04
說了這么多,問題來了:OpenAI 的打法已經(jīng)這么清晰了,那國內(nèi)廠商能學(xué)嗎?
國內(nèi)也有不少團(tuán)隊(duì)在做 AI 視頻,比如:即夢、可靈、百度蒸汽機(jī)。
產(chǎn)品形態(tài),大多「網(wǎng)站工具 + 專業(yè)創(chuàng)作者」。說白了,給剪輯師、工作室用的,不能直接面向大眾的入口級 App。
邏輯也一樣:發(fā)布個(gè)炫酷的 demo,卷一下分辨率和穩(wěn)定性,開始宣傳,這就跟 OpenAI 有明顯差異。
OpenAI 的打法是先 To C,把用戶拉進(jìn)來,再靠用戶習(xí)慣和數(shù)據(jù)反哺模型;而國內(nèi)廠商更多是 To B、TO專業(yè)創(chuàng)作者,先服務(wù)廣告主、MCN、品牌主,換點(diǎn)現(xiàn)金流。
我認(rèn)為,這里面機(jī)會(huì)很大,中國短視頻和社交的土壤,比海外更適合裂變。一個(gè)「客串」功能,可能在國內(nèi)會(huì)比在海外還要猛十倍。
那國內(nèi)也要做一個(gè)TOC視頻的APP嗎?不。
國內(nèi)的流量格局已經(jīng)定型了。抖音、快手、B站、小紅書,百度、這些平臺(tái)已經(jīng)把用戶時(shí)間牢牢鎖死。你再推一個(gè)全新的 App,哪怕模型再炫酷,能搶到多少用戶注意力?
所以,我認(rèn)為更聰明的路子,是「嵌入舊系統(tǒng)」。
你看抖音已經(jīng)在這么干了。比如你發(fā)圖片的時(shí)候,會(huì)自動(dòng)彈出各種「AI 特效」,點(diǎn)一下就能把靜態(tài)圖片變成動(dòng)態(tài)視頻。
這個(gè)過程里,你都不會(huì)意識(shí)到自己在用 AI,只會(huì)覺得「哦,抖音又出了個(gè)新玩法」;這是最厲害的地方:AI 能力被埋進(jìn)熟悉的流程里,用戶無縫接受。
我說的夠詳細(xì)了吧?
反過來,其他平臺(tái)能不能學(xué)?當(dāng)然能。視頻生成模型完全可以拆成一堆小功能:自動(dòng)加字幕、生成過場動(dòng)畫、補(bǔ)一段配音、甚至搞個(gè)「客串」朋友的特效。
不需要學(xué)習(xí)新 App,不需要重新注冊賬號(hào),也不用換生態(tài),就在自己常用的平臺(tái)里點(diǎn)兩下能玩起來,這比單獨(dú)做一個(gè) To C 應(yīng)用更接地氣。
說白了,路徑不同,但邏輯相通:
都要讓用戶順手、低門檻地上手,并且,在用的過程中不斷給模型回?cái)?shù)據(jù)。只不過,Sam的打法是自己做入口,中國的機(jī)會(huì)是在已有入口上「長出新手」。
所以,要我提煉方法論的話,說三點(diǎn):
一,單點(diǎn)原則,先把模型拆成能落地的小組件、小應(yīng)用,先占住一個(gè)點(diǎn)。別喊通用,通用不好做優(yōu)化,變量太多,抽卡行為變化太大。
二,工作流原則,怎么讓別人用起來,用得順手,流程不斷,數(shù)據(jù)才能源源不斷回流;第三點(diǎn),就生態(tài)了。單點(diǎn)只是開頭,慢慢長出產(chǎn)品矩陣,才能形成真正的壁壘。
說到底,點(diǎn)要準(zhǔn),流要順,盤子才會(huì)大。你怎么看?
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.