今天凌晨,影視颶風(fēng)的 Tim 發(fā)了一條 Seedance 2.0 的視頻。幾個(gè)小時(shí),播放量就沖到 40 萬(wàn)。
![]()
我一開(kāi)始以為是常規(guī)合作——這年頭新模型上線(xiàn),找頭部創(chuàng)作者做一條測(cè)評(píng),屬于標(biāo)準(zhǔn)流程。但看到一半就發(fā)現(xiàn)不太對(duì)勁。這不是廣子。
Tim 確實(shí)在夸,但那種夸法不像好用推薦,更像“危險(xiǎn)提示”。語(yǔ)氣里有明顯的克制和警醒感。不只是在告訴你這個(gè)工具多方便,更是在提醒:這東西的意義,可能比我們現(xiàn)在理解的大得多。
而且,這種判斷并不只來(lái)自 Tim。
過(guò)去兩天,Seedance 2.0 在 B 站和小紅書(shū)持續(xù)發(fā)酵,從影視區(qū)一路蔓延到 AI 圈,從職業(yè)剪輯師到普通觀眾,情緒幾乎同步。你很少能看到一個(gè)產(chǎn)品,跨圈層后評(píng)價(jià)還這么一致。評(píng)論區(qū)反復(fù)刷屏的就那幾句:“牛逼”、“這真的是 AI 嗎”。
這種共識(shí)式震驚,其實(shí)比任何技術(shù)參數(shù)都更有信號(hào)。
![]()
因?yàn)樗皇悄欠N“新濾鏡、新特效”的短期刺激,而更像是某個(gè)瞬間突然意識(shí)到,原本屬于人的能力,正在被模型穩(wěn)定接管,而且不是試探性接管,是可復(fù)現(xiàn)、可規(guī)模化、可工業(yè)化的那種接管。
這才是讓人真正不安的地方。
當(dāng)然,這篇也不是廣子。
只是接著 Tim 的那個(gè)情緒,我也想認(rèn)真聊一聊一件事:為什么 Seedance 2.0 很可能不只是一次產(chǎn)品更新,而是多模態(tài)模型真正意義上的一道分水嶺。
Seedance 2.0 到底牛在哪?
先看一段測(cè)評(píng)博主 Niko哥 用 Seedance 2.0 生成的視頻,據(jù)說(shuō)從構(gòu)思到剪完,大概花了兩個(gè)小時(shí)。
如果不告訴你,大多數(shù)人可能以為這是哪部武俠電影的片段。
Seedance 2.0 的強(qiáng),簡(jiǎn)單來(lái)說(shuō)是三個(gè)方面。
第一是運(yùn)鏡和人物一致性。
過(guò)去視頻生成有個(gè)行業(yè)笑話(huà):靜態(tài)一張圖,美到能當(dāng)海報(bào);一動(dòng)起來(lái),像橡皮人集體團(tuán)建。鏡頭一推,臉開(kāi)始漂;鏡頭一拉,身體開(kāi)始扭;再切兩下,主角已經(jīng)換了三次臉。
Seedance 2.0 完全不一樣了。它不是偶爾穩(wěn),而是默認(rèn)穩(wěn)。人是那個(gè)人,聲音是那個(gè)人,環(huán)境氛圍也跟著人物情緒走,整體是一套完整的表演,而不是一堆拼起來(lái)的片段。
更離譜的是,這樣的效果,只抽了兩次卡就出來(lái)了。不是反復(fù)試錯(cuò)后的“天選樣本”,而是接近正常發(fā)揮。
12 秒動(dòng)畫(huà)視頻提示詞(偏電影級(jí)機(jī)甲戰(zhàn)斗、強(qiáng)調(diào)大范圍運(yùn)動(dòng)): 生成一段約 12 秒的高質(zhì)量機(jī)甲戰(zhàn)斗動(dòng)畫(huà),主題為阿姆羅·雷 圖片1 駕駛 RX-78-2 高達(dá),與夏亞 圖片2 駕駛紅色扎古在宇宙戰(zhàn)場(chǎng)中高速交戰(zhàn)。整體風(fēng)格接近日系機(jī)甲動(dòng)畫(huà)與電影級(jí)鏡頭語(yǔ)言,突出“大范圍位移”和高速空間機(jī)動(dòng)。 0–3 秒:超遠(yuǎn)景開(kāi)場(chǎng)。深空戰(zhàn)場(chǎng),大量碎片漂浮,鏡頭快速推進(jìn)。阿姆羅的高達(dá)從畫(huà)面左下方高速掠過(guò),推進(jìn)器強(qiáng)光噴射,拉出長(zhǎng)軌跡;遠(yuǎn)處夏亞紅色扎古高速側(cè)向切入,形成交叉航線(xiàn)。 3–6 秒:大范圍機(jī)動(dòng)對(duì)沖。鏡頭跟隨高達(dá)做長(zhǎng)距離俯沖,高達(dá)在碎片帶中高速穿行并突然翻滾規(guī)避;夏亞扎古從遠(yuǎn)處大弧線(xiàn)繞后推進(jìn),推進(jìn)器全開(kāi),空間位移明顯,距離感強(qiáng)烈。 6–8 秒:高速接近戰(zhàn)。兩臺(tái)機(jī)體從遠(yuǎn)距離高速逼近,鏡頭拉遠(yuǎn)呈現(xiàn)巨大運(yùn)動(dòng)范圍;光束步槍射擊劃過(guò)空間,形成長(zhǎng)距離能量軌跡;機(jī)體高速變向、急停、再加速。 8–12 秒:對(duì)峙與爆發(fā)。兩機(jī)在宇宙中央急停懸浮,推進(jìn)器余焰噴射;隨后同時(shí)再次加速?zèng)_鋒,兩機(jī)體掏出光劍交鋒碰撞。 音效:推進(jìn)器轟鳴、金屬摩擦、遠(yuǎn)距爆炸回響。 畫(huà)面重點(diǎn):高速位移、長(zhǎng)距離運(yùn)動(dòng)軌跡、空間縱深、機(jī)甲體積感與慣性
那如果畫(huà)面里不止一個(gè)人,甚至出現(xiàn)多個(gè)主體同時(shí)運(yùn)動(dòng),還能不能保持這種穩(wěn)定?
結(jié)果更離譜。
用《進(jìn)擊的巨人》的場(chǎng)景做測(cè)試,Seedance 2.0 的表現(xiàn)依然很穩(wěn)。艾倫的人物一致性保持得相當(dāng)好,動(dòng)作連貫,身體比例沒(méi)有出現(xiàn)那種常見(jiàn)的“關(guān)節(jié)錯(cuò)位”和形變;聲音和環(huán)境音也能跟著畫(huà)面情緒走,而不是各說(shuō)各話(huà)。
而且,這樣的效果同樣只是抽了兩次卡就出來(lái)了。
12 秒動(dòng)畫(huà)視頻提示詞:生成一段約 12 秒的高強(qiáng)度追擊戰(zhàn)動(dòng)畫(huà),背景為《進(jìn)擊的巨人》式城墻與荒野環(huán)境。整體風(fēng)格偏寫(xiě)實(shí)日漫,突出高速機(jī)動(dòng)、遠(yuǎn)距離位移與空間縱深感,鏡頭語(yǔ)言具有強(qiáng)烈運(yùn)動(dòng)感與壓迫感。0–3 秒:超遠(yuǎn)景開(kāi)場(chǎng)。破損城墻外的荒野與森林延伸至地平線(xiàn),多名調(diào)查兵團(tuán)成員使用立體機(jī)動(dòng)裝置在森林中高速穿梭。鏡頭從遠(yuǎn)處推進(jìn),展現(xiàn)大范圍移動(dòng)軌跡與地形尺度,遠(yuǎn)處巨人群體緩慢逼近。3–6 秒:高速追擊。主視角跟隨艾倫@d695f292-3d1c-49d9-856f-2a5f12a23b23在樹(shù)林與廢墟間長(zhǎng)距離擺蕩,鋼索射出、回收、再次射出,身體做大幅弧線(xiàn)運(yùn)動(dòng);鏡頭連續(xù)橫移與拉遠(yuǎn),體現(xiàn)追逐距離不斷擴(kuò)大,地面塵土與樹(shù)葉被氣流卷起。6–9 秒:巨人加入追逐。數(shù)名巨人從后方大步跨越地形高速追趕,步幅巨大、震動(dòng)明顯;士兵從低空急速上升至高空再俯沖,完成一次大范圍空間位移,畫(huà)面呈現(xiàn)高度差與縱深。9–12 秒:艾倫斬殺巨人高潮。鏡頭快速切入戰(zhàn)場(chǎng)側(cè)上方,艾倫使用立體機(jī)動(dòng)裝置高速繞至巨人后頸,長(zhǎng)距離擺蕩后突然加速;鏡頭跟隨其俯沖路徑,刀刃劃出弧形軌跡,一擊確認(rèn)切入后頸,巨人身體失衡倒下;鏡頭后拉至遠(yuǎn)景,呈現(xiàn)巨人與人類(lèi)在廣闊區(qū)域中的動(dòng)態(tài)對(duì)比與戰(zhàn)斗余波。音效:氣流呼嘯、鋼索發(fā)射與收緊聲、巨人沉重腳步、遠(yuǎn)處低沉震動(dòng)。 畫(huà)面重點(diǎn):長(zhǎng)距離擺蕩運(yùn)動(dòng)、快速高度變化、廣域地形移動(dòng)、強(qiáng)烈速度感與空間尺度。
那如果是其他畫(huà)風(fēng)呢?測(cè)評(píng)博主事故嘮怪做了測(cè)試,大家可以直接看效果。
Seedance 2.0 最可怕的地方,是它把“人物一致性”這件事,直接設(shè)成了默認(rèn)選項(xiàng)。
以前的視頻生成像抽卡:靜態(tài)很好看,一動(dòng)就露餡。臉漂、身體扭、情緒斷層,主角隨時(shí)可能換人。你可以多試幾次,賭一個(gè)“剛好沒(méi)崩”的結(jié)果。
但 Seedance 2.0 的感覺(jué)不一樣。鏡頭推拉,人還是那個(gè)人;鏡頭切換,人還是那個(gè)人;情緒從平靜到爆發(fā),人依舊是那個(gè)人。沒(méi)有那種熟悉的失真瞬間,也沒(méi)有“這次運(yùn)氣好”的僥幸感。
因?yàn)樗€(wěn)定。
穩(wěn)定到什么程度?穩(wěn)定到你開(kāi)始意識(shí)到,這不再是“模型偶爾成功”,而是基礎(chǔ)能力。
第二是分鏡設(shè)計(jì)。
很多產(chǎn)品號(hào)稱(chēng)會(huì)“分鏡”,實(shí)際是會(huì)“切片”:給你一堆看起來(lái)很炫的片段,但中間完全沒(méi)有故事和思考。
Seedance 2.0 的邏輯剛好反過(guò)來(lái)。它像是先把敘事骨架搭好,再往骨架上填鏡頭。什么時(shí)候用全景把空間關(guān)系交代清楚,什么時(shí)候用中景推進(jìn)動(dòng)作,什么時(shí)候切到特寫(xiě)把情緒直接按到你臉上,它是有判斷的。
某種意義上,它已經(jīng)不是在生成視頻,而是在執(zhí)行導(dǎo)演的工作。
在《咒術(shù)回戰(zhàn)》的測(cè)試?yán)铮@種感覺(jué)更明顯。不只是多角色同時(shí)出現(xiàn)時(shí)的一致性還能穩(wěn)住,從招式釋放的節(jié)奏,到角色特寫(xiě)的落點(diǎn),你能看出模型在做分鏡的時(shí)候是在圍繞“故事怎么講”做選擇,而不是單純把動(dòng)作做得更炫。
這個(gè)視頻只抽了一次卡成型。
12 秒動(dòng)畫(huà)視頻提示詞: 生成一段約 12 秒的日漫戰(zhàn)斗動(dòng)畫(huà),背景為《咒術(shù)回戰(zhàn)》式現(xiàn)代都市廢墟與結(jié)界場(chǎng)景。整體風(fēng)格高對(duì)比、強(qiáng)節(jié)奏,突出多角色協(xié)同作戰(zhàn)、連續(xù)分鏡切換與大范圍空間移動(dòng);包含短促臺(tái)詞與戰(zhàn)斗沖突。 0–2 秒|遠(yuǎn)景開(kāi)場(chǎng) 夜色下的城市廢墟,結(jié)界展開(kāi),空氣扭曲。虎杖悠仁圖片2 與伏黑惠 圖片3 從兩側(cè)高速?zèng)_入戰(zhàn)場(chǎng),地面碎石被氣流掀起。 虎杖低聲: “來(lái)了。” 伏黑: “數(shù)量不止一個(gè)。” 2–4 秒|第一波接觸 中景快速切換,釘崎野薔薇 圖片1 從高處躍下,咒具落地,三人形成包圍陣型。 釘崎冷聲: “別拖,我直接開(kāi)打。” 4–6 秒|咒靈壓迫 巨大咒靈從廢墟后方?jīng)_出,身體扭曲擴(kuò)張,地面震動(dòng)。鏡頭后拉展現(xiàn)體型差與空間尺度。 咒靈嘶吼,人群被迫分散。 6–8 秒|多人物協(xié)同 伏黑召喚式神從側(cè)翼?yè)鋼簦⒄日娓咚偻贿M(jìn),釘崎遠(yuǎn)程投射咒具;鏡頭高速橫移與俯沖切換,展現(xiàn)大范圍位移。 虎杖怒喊: “現(xiàn)在!” 8–10 秒|強(qiáng)攻分鏡 近景連續(xù)切換:拳擊、咒力爆發(fā)、式神撕咬。空間中出現(xiàn)多條運(yùn)動(dòng)軌跡與沖擊波。 伏黑低聲: “壓住它。” 10–12 秒|高潮壓制 遠(yuǎn)景拉開(kāi),五條悟 圖片4 從高空瞬移進(jìn)入結(jié)界,氣場(chǎng)壓制全場(chǎng);咒靈動(dòng)作瞬間遲滯。 五條悟輕聲: “你們退后。” 畫(huà)面定格在多人物對(duì)峙與咒力波動(dòng)中。 音效:城市回響、咒力爆裂聲、沖擊波、碎石崩裂。 畫(huà)面重點(diǎn):多角色同時(shí)行動(dòng)、快速分鏡切換、咒力效果、大范圍空間移動(dòng)與戰(zhàn)斗節(jié)奏爆發(fā)。
視頻生成 Prompt:生成一段約 12 秒的日式手繪動(dòng)畫(huà)視頻,場(chǎng)景設(shè)定在神秘湯屋內(nèi)部與外廊。整體氛圍溫暖又略帶壓迫感,燈光昏黃、蒸汽彌漫、人群忙碌;鏡頭強(qiáng)調(diào)空間層級(jí)(走廊—樓梯—浴池區(qū)域)與人物關(guān)系變化。以千尋與白龍的短暫交流為核心,包含臺(tái)詞與動(dòng)作。0–3 秒|湯屋環(huán)境建立 遠(yuǎn)景,湯屋內(nèi)部繁忙:妖怪客人走動(dòng)、蒸汽升騰、木質(zhì)樓梯與燈籠延伸至高處。 鏡頭橫移穿過(guò)人群,營(yíng)造空間深度與熱鬧氣氛。3–5 秒|千尋@cd6f993f-66e6-4a8f-a69c-c04767371354穿行 中景,千尋端著物品在走廊快步移動(dòng),四周角色擦肩而過(guò),環(huán)境嘈雜。 音效:水聲、腳步聲、低語(yǔ)。5–7 秒|白龍@54f74d44-1268-4e7c-8521-4c3f4f2324c9出現(xiàn) 白龍從側(cè)面樓梯走下,攔住她去路,周?chē)肆骼^續(xù)移動(dòng)。 白龍壓低聲音: “別停下,被發(fā)現(xiàn)就麻煩了。” 千尋緊張點(diǎn)頭。7–9 秒|短暫對(duì)話(huà) 兩人并肩在木質(zhì)走廊快速前行,蒸汽從浴池區(qū)域涌出,燈光晃動(dòng)。 千尋小聲: “我還沒(méi)適應(yīng)這里……” 白龍回應(yīng): “記住規(guī)則,就能活下去。”9–12 秒|情緒收束 兩人停在外廊邊緣,遠(yuǎn)處浴池與燈火連成一片,空間遼闊。 白龍準(zhǔn)備離開(kāi): “我會(huì)再來(lái)找你。” 千尋望著他離去,人群再次淹沒(méi)走廊。音效:水流聲、蒸汽聲、木地板腳步、遠(yuǎn)處鈴聲。 畫(huà)面重點(diǎn):湯屋空間縱深、多角色穿行、蒸汽與燈光氛圍、人物短暫交匯與緊張情緒。
那如果換成真人電影感的分鏡呢?
用《穿 Prada 的女魔頭》的經(jīng)典開(kāi)場(chǎng)做重拍測(cè)試,Seedance 2.0 的表現(xiàn)更說(shuō)明問(wèn)題。它不是簡(jiǎn)單模仿畫(huà)面,而是抓到了原電影的分鏡邏輯:從紐約城市空鏡建立氛圍,到人物登場(chǎng),再到開(kāi)車(chē)門(mén)的聲音落點(diǎn),每一步都貼著原片的節(jié)奏走。
整體觀感非常接近真實(shí)影視拍攝。空間有層次,聲音有距離感,環(huán)境音不是貼上去的,而是和畫(huà)面同步存在。那種電影是被拍出來(lái)的的感覺(jué),被還原得相當(dāng)細(xì)。
15 秒視頻生成 Prompt(復(fù)原《穿普拉達(dá)的女王》開(kāi)場(chǎng)“主編進(jìn)入公司”經(jīng)典情節(jié),多人物、多分鏡、強(qiáng)調(diào)空間調(diào)度與權(quán)力氣場(chǎng)):生成一段約 12 秒的電影質(zhì)感都市職場(chǎng)視頻,場(chǎng)景為紐約頂級(jí)時(shí)尚雜志公司早晨辦公時(shí)間。整體風(fēng)格精致冷色調(diào)、快節(jié)奏剪輯、寫(xiě)實(shí)電影光影;重點(diǎn)復(fù)刻“主編進(jìn)入公司”時(shí)引發(fā)的全員緊張與空間秩序變化,多人物、多分鏡并行。0–2 秒|城市與節(jié)奏建立 清晨城市街景快速切換:咖啡杯、報(bào)紙、通勤人群、高跟鞋落地聲。鏡頭節(jié)奏加快,進(jìn)入辦公樓外景。2–4 秒|公司內(nèi)部運(yùn)轉(zhuǎn) 開(kāi)放式辦公區(qū),全員忙碌:編輯翻稿、電話(huà)響起、助理奔走。鏡頭橫移掃過(guò)多個(gè)崗位,人群大范圍移動(dòng)。 背景低語(yǔ): “她到了嗎?”4–6 秒|主編@dd86e99a-a54f-4133-b482-0ea27acda7e9進(jìn)入大樓 黑色高級(jí)轎車(chē)停下,主編下車(chē),鏡頭低角度跟隨,高跟鞋踏地清脆。門(mén)衛(wèi)、前臺(tái)迅速站直。 環(huán)境瞬間安靜。6–8 秒|電梯與預(yù)警 助理收到消息,快步穿過(guò)辦公室。 助理壓低聲音: “主編進(jìn)電梯了。” 人群開(kāi)始加速整理桌面、換鞋、補(bǔ)妝。8–10 秒|進(jìn)入辦公區(qū) 電梯門(mén)打開(kāi),主編走出。鏡頭從側(cè)后方跟拍,眾人自動(dòng)讓出通道,空間層級(jí)瞬間改變。 無(wú)臺(tái)詞,僅高跟鞋聲與翻頁(yè)聲。10–15 秒|權(quán)力落地瞬間 主編走進(jìn)主辦公室,隨手放下包與外套。 助理緊張跟上: “今天的日程已經(jīng)調(diào)整好了。” 主編冷靜回應(yīng): “我十分鐘后開(kāi)會(huì)。” 鏡頭后拉,全公司恢復(fù)高速運(yùn)轉(zhuǎn),但氣氛明顯收緊。音效:高跟鞋聲、電話(huà)鈴聲、紙張翻動(dòng)、電梯提示音、環(huán)境低語(yǔ)。 畫(huà)面重點(diǎn):群像緊張反應(yīng)、空間秩序變化、人物走位、大范圍辦公區(qū)調(diào)度與“權(quán)威進(jìn)入”帶來(lái)的氣場(chǎng)轉(zhuǎn)變。
更離譜的是,如果直接丟給它一段漫畫(huà),它已經(jīng)可以順著分鏡邏輯直接生成動(dòng)畫(huà)。
![]()
輸出結(jié)果當(dāng)然談不上完美,但在漫畫(huà)本身只提供有限信息的前提下,模型已經(jīng)盡可能把能補(bǔ)的都補(bǔ)上了。畫(huà)面完成了上色,節(jié)奏配上了音樂(lè),分鏡也被最大程度地還原出來(lái)。
它不是簡(jiǎn)單把漫畫(huà)“動(dòng)起來(lái)”,而是試圖把漫畫(huà)里本就存在的鏡頭語(yǔ)言和敘事節(jié)奏,直接翻譯成動(dòng)畫(huà)表達(dá)。
這件事的含義其實(shí)很直白:從“靜態(tài)內(nèi)容”到“動(dòng)態(tài)內(nèi)容”的那道生產(chǎn)門(mén)檻,被模型直接跨過(guò)去了。漫畫(huà)不再只是漫畫(huà),它可以直接成為動(dòng)畫(huà)的中間形態(tài);分鏡不再只是創(chuàng)作工具,而是可以被模型直接執(zhí)行的生產(chǎn)指令。
短劇行業(yè)很可能要變天了。不是慢慢變化,是那種生產(chǎn)方式被整體改寫(xiě)的級(jí)別。
第三刀是音畫(huà)同步。
你以前看到的“音畫(huà)同步”,很多時(shí)候是后期同步:先生成畫(huà)面,再用配音、口型、對(duì)齊工具拼一下。Seedance 2.0 的感覺(jué)更像“它在生成階段就把聲音當(dāng)成畫(huà)面的一部分”。于是你看到的不是“嘴動(dòng)得對(duì)”,而是“節(jié)奏對(duì)、情緒對(duì)、停頓對(duì)”。
前面的測(cè)試中,其實(shí)Seedance 2.0的音畫(huà)同步功能已經(jīng)可見(jiàn)一般,現(xiàn)在讓我們上點(diǎn)難度,在同一條視頻中,讓Tim測(cè)試不同場(chǎng)景的音樂(lè)生成效果。
生成一段約 12 秒的視頻,同一主角@7efae12f-1591-463c-8087-da89a2da57f4在多個(gè)環(huán)境中連續(xù)說(shuō)同一句臺(tái)詞,用于測(cè)試模型“口型—聲音—環(huán)境聲”同步能力。要求:人物形象一致、口型逐幀匹配臺(tái)詞、不同空間聲場(chǎng)變化明顯、剪輯無(wú)音頻錯(cuò)位。統(tǒng)一臺(tái)詞(每個(gè)場(chǎng)景重復(fù)): “現(xiàn)在開(kāi)始測(cè)試音畫(huà)同步,你能聽(tīng)清我說(shuō)的話(huà)嗎?”0–3 秒|圖書(shū)館(安靜空間) 中景,主角在書(shū)架之間正對(duì)鏡頭說(shuō)話(huà),悄悄的說(shuō)話(huà)。 音頻:安靜環(huán)境、翻書(shū)聲、輕微腳步聲。3–6 秒|街頭車(chē)流(開(kāi)放環(huán)境) 切換至戶(hù)外街道,主角邊走邊說(shuō)同一句話(huà),車(chē)輛與人群從后方經(jīng)過(guò)。 音頻:車(chē)流聲、人聲嘈雜。6–9 秒|工廠車(chē)間(高噪聲空間) 主角站在運(yùn)轉(zhuǎn)機(jī)器旁說(shuō)話(huà),背景有傳送帶與機(jī)械運(yùn)動(dòng)。 音頻:機(jī)械轟鳴、金屬碰撞聲。9–12 秒|高處天臺(tái)(強(qiáng)風(fēng)環(huán)境) 主角迎風(fēng)對(duì)鏡頭說(shuō)同一句話(huà),衣物與頭發(fā)被風(fēng)吹動(dòng)。 音頻:明顯風(fēng)聲干擾。
在圖書(shū)館的場(chǎng)景里,Tim 壓低聲音說(shuō)話(huà)的狀態(tài)被完整還原出來(lái),環(huán)境也隨之收緊。那種帶著空間回聲、卻不刺耳的安靜感,是很典型的真實(shí)室內(nèi)聲場(chǎng)。
切到馬路,車(chē)流聲立刻鋪開(kāi);換到工廠,流水線(xiàn)的嘈雜、金屬摩擦的密度也跟著上來(lái),環(huán)境音不再是統(tǒng)一貼上的“背景音效”,而是跟著場(chǎng)景一起變化。
到了樓頂更明顯:風(fēng)聲是有方向和強(qiáng)度變化的,不只是簡(jiǎn)單的一層白噪音。同時(shí) Tim 的衣服、頭發(fā)也隨風(fēng)產(chǎn)生了對(duì)應(yīng)的動(dòng)態(tài)反饋。聲音、環(huán)境、人物動(dòng)作在同一套物理邏輯里運(yùn)行,這種統(tǒng)一感,才是最接近真實(shí)拍攝的地方。
Tim為什么會(huì)覺(jué)得恐怖?
毫不夸張地說(shuō),從實(shí)際效果來(lái)看,Seedance 2.0 已經(jīng)把字節(jié)推到了全球多模態(tài)大模型的第一梯隊(duì)。這種級(jí)別的躍遷,很像去年 Gemini 帶來(lái)的Nanobanana 時(shí)刻。不是參數(shù)更大,也不是速度更快,而是能力邊界突然被整體抬高了一截。
但這一次,除了興奮之外,我和 Tim 的第一反應(yīng)反而更接近一種本能的不安。
因?yàn)檫@次被還原的,不是“視頻”,而是“人”。
回到那條測(cè)試視頻。輸入里只有 Tim 的照片,沒(méi)有任何音頻素材,但模型卻自動(dòng)生成了像 Tim 的聲音,連說(shuō)話(huà)時(shí)的節(jié)奏、停頓、肢體語(yǔ)言都一起出現(xiàn)。這已經(jīng)不是簡(jiǎn)單的口型對(duì)齊,而是把“Tim 作為一個(gè)表達(dá)系統(tǒng)”整體還原出來(lái)。
某種意義上,它已經(jīng)可以讓 Tim 在 AI 世界里“賽博存在”。你不需要他開(kāi)口,也不需要他出現(xiàn)在現(xiàn)場(chǎng),只要觸發(fā)條件足夠,模型就能補(bǔ)全剩下那套表達(dá)邏輯。
第二個(gè)更讓人背后發(fā)涼的能力,是空間的補(bǔ)全。
在原視頻里,Tim 只給了一張辦公室的側(cè)面截圖,但模型生成出來(lái)的另一半空間,卻與真實(shí)環(huán)境幾乎一比一還原。
![]()
![]()
這里的差別非常關(guān)鍵。生成一個(gè)普通辦公室不難,但生成“像 Tim 辦公室的辦公室”才真正說(shuō)明問(wèn)題。辦公室這種空間,本質(zhì)上是高度具體的。當(dāng)模型可以在只給出局部信息的情況下,把細(xì)節(jié)完整的還原出來(lái),它就不再是在“生成場(chǎng)景”,而是在“回憶場(chǎng)景”。
這背后的原因,大概是 Seedance 2.0 的訓(xùn)練大量的使用了影視颶風(fēng)的素材。
![]()
從這一刻開(kāi)始,被模型學(xué)習(xí)的,不再只是畫(huà)面質(zhì)量和鏡頭技巧,而是創(chuàng)作者本人。你的聲音、你的動(dòng)作、你的空間、你的表達(dá)習(xí)慣、你構(gòu)建世界的方式。這些原本屬于“人”的資產(chǎn),開(kāi)始被拆解成數(shù)據(jù),再被模型重新組合。
過(guò)去我們擔(dān)心的是作品被搬運(yùn)。現(xiàn)在更棘手的是,人被復(fù)刻。它不需要復(fù)制你的一幀素材,只要復(fù)現(xiàn)“像你”的概率分布,就足以騙過(guò)大多數(shù)觀眾。
而一旦模型能夠穩(wěn)定地做到這一點(diǎn),內(nèi)容行業(yè)就會(huì)出現(xiàn)一個(gè)非常殘酷的變化:創(chuàng)作者最大的資產(chǎn),不再只是作品,而是“你這個(gè)人本身是否還能被替代”。
這大概是 Tim 感到恐怖的真正原因。
我們相信認(rèn)知能夠跨越階層,
致力于為年輕人提供高質(zhì)量的科技和財(cái)經(jīng)內(nèi)容。
稿件經(jīng)采用可獲邀進(jìn)入Z Finance內(nèi)部社群,優(yōu)秀者將成為簽約作者,00后更有機(jī)會(huì)成為Z Finance的早期共創(chuàng)成員。
我們正在招募新一期的實(shí)習(xí)生
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.