![]()
當(dāng)硅谷還在討論 Sora 的“世界模擬器”宏大敘事時,字節(jié)跳動用 Seedance 2.0 的發(fā)布,悄然劃開了視頻生成領(lǐng)域的第二條河流。
這兩條河流,一條向西,試圖窮盡物理世界的底層規(guī)律;一條向東,試圖解構(gòu)人類內(nèi)容的消費(fèi)邏輯。
2月9日凌晨,知名科技博主影視颶風(fēng) Tim 發(fā)布了關(guān)于字節(jié)跳動 Seedance 2.0 的評測視頻,將其稱為“改變視頻行業(yè)的 AI”。
但這不僅僅是對字節(jié)跳動一家公司的評價(jià),更像是對整個 AI 視頻生成賽道按下加速鍵。Seedance 2.0 的發(fā)布,以及 Tim 在評測中感受到的“恐怖”與“震撼”,標(biāo)志著這場戰(zhàn)爭已經(jīng)從單純的參數(shù)競賽,進(jìn)入了商業(yè)落地與倫理博弈的深水區(qū)。
定義權(quán)之爭:物理引擎 vs. 導(dǎo)演思維
在 OpenAI 的敘事里,Sora 是“世界模擬器”,它試圖讓像素遵循牛頓定律,追求的是“仿真”。
但在 Seedance 2.0 身上,字節(jié)跳動講了一個完全不同的故事。體驗(yàn)過之后你會發(fā)現(xiàn),它并不執(zhí)著于做一個物理學(xué)家,它更像是一個極其成熟的“商業(yè)導(dǎo)演”,致力于讓鏡頭遵循視聽語言。
Tim 在視頻中透露了一個令人驚訝的細(xì)節(jié):他在沒有上傳任何聲音文件、任何提示的情況下,僅將自己的人臉照片上傳至模型,系統(tǒng)就能自動生成與他本人高度相似的聲音,甚至能精準(zhǔn)匹配語氣特質(zhì)。
這種“無中生有”的匹配能力證明,Seedance 2.0 掌握的 Know-how 不再是單純的視覺生成,而是對“人”的整體重構(gòu)。它不需要你告訴它怎么說話,因?yàn)樗缇汀罢J(rèn)識”你。
敘事的差異,最終投射在商業(yè)模式的殊途上。
OpenAI 依然沿襲著 SaaS 的精英主義邏輯,做“軍火商”,向?qū)I(yè)人士販賣 API。而集成在字節(jié)生態(tài)中的 Seedance 2.0,走的是“超級應(yīng)用”(Super App)的邏輯,意在消滅專業(yè)門檻。
當(dāng) OpenAI 還在思考如何讓好萊塢導(dǎo)演付費(fèi)時,字節(jié)跳動似乎已經(jīng)通過“造夢”,完成了對大眾創(chuàng)作者的一次技術(shù)平權(quán)。
殊途同歸的“世界模型”競賽
如果把視角拉得更遠(yuǎn),我們會發(fā)現(xiàn)字節(jié)跳動并不孤獨(dú)。在過去的一年里,視頻生成模型顯得擁擠不堪,全球科技巨頭正集體奔赴同一個終極目標(biāo):構(gòu)建一個能夠理解、模擬甚至預(yù)測現(xiàn)實(shí)世界的“世界模型”(World Model)。
- OpenAI (Sora)試圖用 Transformer 架構(gòu)讓 AI 理解物理規(guī)律。
- Google (Veo/Lumiere)憑借其在 YouTube 上的積累,試圖解決長視頻的一致性問題。
- NVIDIA則試圖在工業(yè)層面 1:1 還原物理世界,服務(wù)于機(jī)器人訓(xùn)練。
- 而在中國,快手可靈阿里通義騰訊混元也在瘋狂迭代,試圖在 C 端應(yīng)用上搶占先機(jī)。
在這場軍備競賽中,數(shù)據(jù)是唯一的燃料。無論是 OpenAI 還是字節(jié)跳動,誰擁有更多、更豐富的數(shù)據(jù),誰的模型就越接近“全知”。
Tim 在評測中提到了一個讓他倍感“恐怖”的瞬間,揭示了當(dāng)前頂級模型的共同特征:
“最恐怖的一點(diǎn)是不只我的聲音,我們上傳的照片只有樓的正面,但是生成出來的運(yùn)鏡,可以轉(zhuǎn)到樓的另一面,它知道我背后的東西是什么,即便我沒有告訴它。”
這棟樓的背面,可能出現(xiàn)在影視颶風(fēng)過去的某個視頻里,也可能出現(xiàn)在其他用戶的街拍中。AI 將這些碎片化的信息拼接,在神經(jīng)網(wǎng)絡(luò)中重建了這棟樓的 3D 結(jié)構(gòu)。
不僅僅是字節(jié),OpenAI 的 Sora 之所以能生成逼真的東京街頭,Google 的模型之所以能生成流暢的動作,背后都是對海量公開互聯(lián)網(wǎng)數(shù)據(jù)的學(xué)習(xí)。
技術(shù)倫理的邊界
這引出了一個全行業(yè)都需要正視的命題:我們與平臺之間,是否存在一份“隱形的契約”?
過去,我們認(rèn)為自己在免費(fèi)使用平臺發(fā)布內(nèi)容,換取流量和關(guān)注。但在 AI 時代,這份契約增加了新的條款:你的行為、你的影像、你的聲音,都將成為訓(xùn)練“世界模型”的養(yǎng)料。
Tim 在測試中發(fā)現(xiàn),Seedance 2.0 對其他博主(比如何同學(xué))的形象還原度極高。這意味著,在這個閉環(huán)里,創(chuàng)作者不僅是內(nèi)容的使用者,更是內(nèi)容的“原材料”。只要你在互聯(lián)網(wǎng)上留下了足夠的痕跡,你就在某種程度上被 AI “數(shù)字化”了。
這是一個中性的技術(shù)事實(shí),但它帶來了不得不思考的后果。正如 Tim 在視頻末尾的警示:
“你現(xiàn)在就能夠看到,如果一個人的數(shù)據(jù),全部進(jìn)入了 AI 的數(shù)據(jù)集,會發(fā)生什么。它能夠 100% 模擬出你的任何形態(tài),還有聲音,那請問這樣的內(nèi)容你的家人分得出真假嗎?”
這并非針對某一家公司的指責(zé),而是技術(shù)發(fā)展到特定階段的必然拷問。當(dāng) Google、OpenAI、字節(jié)跳動和 NVIDIA 的模型都足夠強(qiáng)大時,“真實(shí)”的定義將被永久改寫。
影視颶風(fēng) Tim 說:“改變視頻行業(yè)的 AI,快來了。”
但在我們看來,它其實(shí)已經(jīng)到了。Seedance 2.0 只是全球“世界模型”浪潮中的一個縮影。
在這場中美科技巨頭的集體沖鋒中,視頻生成正在從“炫技”走向“實(shí)用”,從“模擬物理”走向“重構(gòu)現(xiàn)實(shí)”。對于身處其中的每一個創(chuàng)作者和用戶而言,我們既是這場技術(shù)革命的受益者,也是它最基礎(chǔ)的貢獻(xiàn)者。
未來已來,只是分布在每一個被 AI 記住的鏡頭里。(作者|AGI-Signal,編輯|DeepWrite秦報(bào)局)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.