<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      可靈3.0加入AI拜年戰(zhàn)場(chǎng)!人在工位搓好萊塢大片,分鏡邏輯封神

      0
      分享至

      夢(mèng)瑤 發(fā)自 凹非寺
      量子位 | 公眾號(hào) QbitAI

      不是,誰(shuí)也沒跟我說(shuō)今年的AI春節(jié)大戰(zhàn)搞得這么猛猛猛?。??!

      年還沒到呢,可靈就超絕不經(jīng)意甩出一個(gè)「過(guò)大年計(jì)劃」:推出可靈3.0多模態(tài)全家桶。

      讓每個(gè)人,都能上桌當(dāng)——大導(dǎo)演



      我主打一個(gè)先嘗為快!先看我導(dǎo)的這出《拳王》(賽博版)動(dòng)作大戲,10秒鐘狂切6個(gè)分鏡頭:



      好萊塢大片也是手拿把掐,10秒鐘切換7個(gè)鏡頭,從引擎轟鳴火花飛濺,再到男女主激烈爭(zhēng)執(zhí),讓我這個(gè)導(dǎo)演有點(diǎn)汗流浹背了...

      災(zāi)難片自然我也不在怕的,濃霧封城、街道廢棄、廣告牌瘋狂搖晃……咋樣,是不是有點(diǎn)《后天》內(nèi)味兒了:

      不光我一個(gè)人玩嗨了,各位腦洞大開的網(wǎng)友們也紛紛share自己的大作了,下面這小哥直接搓出來(lái)了個(gè)超燃籃球賽大片,并直言夠逼真!??!



      還有網(wǎng)友感慨,以后拍電影怕是都不用找真人演員了,這不嘛,人家直接找AI演了波超抽象的家庭大戲,腦洞太大了…



      反正這波實(shí)測(cè)下來(lái)我最直觀感受就是:

      智能分鏡能力確實(shí)夯,模型確實(shí)更能理解鏡頭語(yǔ)言了,像文字和人物的一致性上表現(xiàn)也蠻超出預(yù)期。

      具體哪些功能最好用、適合啥樣的使用場(chǎng)景,我也幫友友們整理好了(省流版):

      1)智能分鏡|音畫同步|主體一致性:特別適合做多鏡頭多對(duì)話的AIGC視頻,在AI短劇、影視這類場(chǎng)景非常適用。

      2)文字一致性:賊適合處理AI電商廣告等場(chǎng)景的文字信息,文本形態(tài)基本能做到1:1還原!

      具體實(shí)測(cè)效果咱往下看,順帶也歡迎大家來(lái)評(píng)評(píng)我這幾部春節(jié)檔大片,導(dǎo)的水平到底行不行?

      先來(lái)測(cè)測(cè):視頻3.0

      跟手動(dòng)拆分鏡說(shuō)byebye

      咱們?nèi)粘I梢曨l時(shí),一直不停反復(fù)抽卡的主要原因之一便是——提示詞太長(zhǎng)、鏡頭太多,視頻模型接不住。

      尤其是經(jīng)常做AI短劇、AIGC自媒體的朋友,對(duì)鏡頭切換的數(shù)量和質(zhì)量要求都比較高,這類問(wèn)題就更明顯了……

      好消息是,在全新的可靈視頻3.0生成頁(yè)面中,直接給模型安排上了個(gè)「分鏡」小版塊,長(zhǎng)下面zhei樣:



      平臺(tái)一共給咱提供了兩種形式:智能分鏡自定義分鏡

      我在智能分鏡中,我們可以直接把一整段包含多鏡頭、多動(dòng)作、多角色的提示詞一股腦丟進(jìn)去,AI會(huì)自動(dòng)幫我們分成不同的鏡頭。

      我最近正好在重溫《甄嬛傳》,但光看劇已經(jīng)有點(diǎn)不過(guò)癮了,索性直接讓AI來(lái)一段后宮宮斗cut,于是我給它喂了一大段帶雙人對(duì)話、明確鏡頭切換的復(fù)雜提示詞:



      于是乎,一個(gè)陰雨夜貴妃貓娘娘和大臣小狗對(duì)峙的宮斗片段的畫面就新鮮出爐了,別說(shuō)還真有點(diǎn)緊張刺激那味兒了?

      我給出的提示詞中涉及了一個(gè)場(chǎng)景,四個(gè)鏡頭,兩段角色對(duì)話和一個(gè)背景音樂(lè)。

      先說(shuō)優(yōu)點(diǎn),我只能說(shuō)這智能分鏡確實(shí)挺智能,涉及到的鏡頭、臺(tái)詞全部1:1地還原了,respect??!

      在音頻處理上,小貓和小狗的語(yǔ)氣、情緒和臺(tái)詞匹配度很高,發(fā)音里的輕重緩急也處理得不錯(cuò),角色的表情和眼神跟對(duì)白對(duì)得也很準(zhǔn)。

      唯一的大bug:背景音樂(lè)沒給我生成要,是能再來(lái)一段BGM就更對(duì)味兒了……

      咱再玩點(diǎn)有意思的,來(lái)點(diǎn)跨界融合看看效果,我給出的提示詞如下:



      大明星貓貓一個(gè)眼神給出去,直接現(xiàn)場(chǎng)教學(xué)啥叫“身體成了一個(gè)X型”,別說(shuō)這小身材搭配這小眼神整的還挺曼妙:

      角色情緒和眼神動(dòng)作都完全拿捏到位,而且貓貓的特寫鏡頭給的特別好,看來(lái)這AI是懂點(diǎn)鏡頭語(yǔ)言的。

      唯一的小bug出現(xiàn)在了臺(tái)詞上。

      原本提示詞里明確是小狗說(shuō)“老師”,但模型在生成時(shí)把這句臺(tái)詞順帶分給了小貓,導(dǎo)致角色說(shuō)話的對(duì)應(yīng)關(guān)系被打亂,整體臺(tái)詞邏輯出現(xiàn)了點(diǎn)偏差~

      (我猜可能跟我提示詞的動(dòng)詞太多有關(guān)系……)

      總的來(lái)說(shuō),智能分鏡本身是靠譜的,多鏡頭結(jié)構(gòu)基本不會(huì)出大問(wèn)題,只是在臺(tái)詞和音頻分配上偶爾會(huì)冒出一些小bug~

      人物一致性更穩(wěn)了

      咱平日里只要生成涉及「主體角色」的AI視頻,有個(gè)幾乎90%都會(huì)遇到的問(wèn)題——

      角色明明只是換了個(gè)動(dòng)作,結(jié)果上一秒和下一秒長(zhǎng)得就已經(jīng)不是同一個(gè)人了……



      也不知道可靈這回受了啥啟發(fā),在視頻3.0中直接搞了個(gè)多圖或視頻的主體參考功能。

      我們可以直接綁定人物角色形象,并上傳不同視角的參考圖,這樣一來(lái)模型在主體識(shí)別上就更穩(wěn)穩(wěn)穩(wěn)了。

      當(dāng)然,穩(wěn)不穩(wěn)還得——實(shí)測(cè)說(shuō)了算!

      為了更好考察模型的主體遵循能力,這次我喂給AI的是一段包含人物多視角、多動(dòng)作的提示詞,并上傳了兩個(gè)不同視角的人物形象照:



      一個(gè)火急火燎、趕著打卡的上班牛馬,在馬路上橫沖直撞的名場(chǎng)面視頻,這不就到手了嘛(doge):



      為了讓友友們更清楚地做對(duì)比,我把我輸入和輸出的角色形象截取對(duì)比了一下,大家覺得主體一致性表現(xiàn)如何???



      emm…我是覺得鏡頭1和3和我給的原參考形象是近乎1:1還原的,但是鏡頭2就明顯出現(xiàn)了問(wèn)題。

      人物的膚色明顯變深了,發(fā)型也從原本的斜偏,直接變成了寸頭……

      我懷疑這里頭的原因可能是因?yàn)槲椅菇oAI的本身沒有嚴(yán)格意義上的正面形象,所以AI自己腦補(bǔ)了一下?

      整體來(lái)說(shuō)可以給個(gè)80分內(nèi)樣。



      字形穩(wěn)得住,方言還得再練

      這次,可靈視頻3.0打的第三個(gè)招牌就是——字形保留高保真。(翻譯:俺們AI生出來(lái)的字兒不變形

      好大的口氣,大家都要知道,相比角色一致性,文字一致性其實(shí)更難。

      那我就不客氣了,這次我給出AI的需求指令中,明確提到了光影變化、鏡頭切換以及旁白配合的多鏡頭場(chǎng)景,這就要求AI在不斷運(yùn)動(dòng)和切換的過(guò)程中,依然能保持較高的文字一致性:



      大家伙快來(lái)看看,AI給我搓出來(lái)了個(gè)近乎達(dá)到「商用水平」的香水廣告宣傳片demo:

      即便鏡頭處在持續(xù)旋轉(zhuǎn)運(yùn)動(dòng)中,香水瓶身的logo文字依舊保持清晰、不變形。

      這其實(shí)也說(shuō)明了模型在文字結(jié)構(gòu)理解、空間變換下的穩(wěn)定渲染以及跨鏡頭一致性保持上的能力已經(jīng)相當(dāng)扎實(shí)了。



      最后,咱再來(lái)試一個(gè)可靈3.0視頻模型中我自認(rèn)為非常有意思的一個(gè)能力——說(shuō)方言

      按照官方的說(shuō)法,模型支持中、英、日、韓、西多語(yǔ)種生成,四川話、粵語(yǔ)等地道方言與各地口音。

      要是這樣的話,我有個(gè)大膽的想法,咱讓奧特曼和馬斯克跑天津來(lái)吃煎餅果子,順便來(lái)一段地地道道的“貫口”:



      倆人大褲衩子大背心一穿,吃大餅吃的那叫一個(gè)香啊,你別說(shuō),還挺入鄉(xiāng)隨俗???

      畫面這塊基本沒啥可挑的,直接給滿分,人物主體一致性也確實(shí)還原得很到位,馬斯克和奧特曼本人看了估計(jì)都得一愣!??!

      但問(wèn)題也很明顯,咱這一題考的其實(shí)是方言能力,事實(shí)上,兩位一個(gè)天津話沒說(shuō)對(duì),一個(gè)北京話也沒對(duì)上,反倒普通話說(shuō)得相當(dāng)標(biāo)準(zhǔn)……

      我一度懷疑是不是AI對(duì)北京話、天津話不太熟,于是我索性再加一道題,讓AI再生成了一個(gè)兵馬俑說(shuō)四川方言的視頻:

      這回對(duì)味兒了,雖然兵馬俑長(zhǎng)相有點(diǎn)驚悚,但是這四川話說(shuō)的倒是蠻厲害的。

      (有沒有四川的朋友點(diǎn)評(píng)一下,這口音說(shuō)的正宗不??)

      再來(lái)測(cè)測(cè):視頻O3 OMNI

      除了O3視頻模型,可靈這次還順手上新了另一位全能視頻選手——O3 OMNI,那這OMNI具體能干點(diǎn)啥呢:

      • 主體相似度上了一個(gè)level,模型對(duì)復(fù)雜提示詞的理解更到位了,用在多鏡頭、多動(dòng)作場(chǎng)景里更穩(wěn)。
      • 上傳一段3–8秒的角色視頻就能提取外觀和聲音,多圖主體模式下再補(bǔ)一段3秒以上人聲就能綁定固定聲線
      • 支持原生自定義分鏡,視頻時(shí)長(zhǎng)也升級(jí)到15秒,很適合需要講清楚一段故事、或者做中長(zhǎng)視頻內(nèi)容的友友。



      咱先來(lái)看對(duì)復(fù)雜文本指令的遵循能力如何~

      這次我喂給AI一段同時(shí)考察主體一致性、連續(xù)加減速的運(yùn)動(dòng)理解,以及多區(qū)域切換時(shí)的鏡頭跟隨與時(shí)序控制的提示詞:



      10秒內(nèi),萬(wàn)圣節(jié)的小兔子完成了跳躍動(dòng)作,并依次穿過(guò)落葉地面、南瓜燈和墓碑三個(gè)區(qū)域,自動(dòng)補(bǔ)全了參考圖中未給出的萌萌視頻,不戳不戳??!

      接下來(lái)玩玩分鏡頭敘事功能。

      在全新的「O3 OMNI」模型里,我們可以直接自定義分鏡,這次我上傳了兩張參考圖(香蕉貓+優(yōu)雅企鵝),然后把分鏡腳本也一并塞了進(jìn)去:



      然后我就會(huì)得到一個(gè)香蕉貓和優(yōu)雅企鵝在紐約街頭盤算著吃豆腐腦的「抽象抓馬」大戲:暴露出來(lái)的問(wèn)題也不少:第一幀背景白底直接出錯(cuò),后半段香蕉貓的嘴形沒對(duì)上,角色和背景的融合度也偏低,整體看下來(lái),這是這輪里生成效果最差的一個(gè)……

      (我是覺得不如智能分鏡的效果好)

      而且說(shuō)實(shí)話,對(duì)我來(lái)說(shuō)這種需要自定義鏡頭的方式也略微麻煩。

      既要上傳參考圖,又要自己拆分鏡頭、逐一標(biāo)注每個(gè)鏡頭的主體,如果折騰這么一圈,最后生成效果還不理想,u1s1,多少會(huì)有點(diǎn)難受……

      感覺「自定義分鏡」功能還是更適合對(duì)提示詞和分鏡腳本比較熟的朋友去用。

      如果需求沒那么高、又像我一樣對(duì)提示詞不算精通的話,還是更推薦大家直接用「智能分鏡」。



      突然想起來(lái),我上一次用可靈還是在測(cè)試O1模型,這次實(shí)測(cè)下來(lái),能明顯感覺到3.0相比O1好用、也好玩了不少。

      bug確實(shí)也有,但大部分也是現(xiàn)在多模態(tài)模型的通病,模型對(duì)于咱日常工作娛樂(lè)來(lái)說(shuō)足夠用了。

      可靈的黑金會(huì)員可以先在Web端體驗(yàn)一波,非黑金用戶也不用急,感覺全面開放應(yīng)該很快就會(huì)來(lái)~

      (期待一下叭)

      聲明:包含AI生成內(nèi)容

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      美軍企創(chuàng)始人用卷尺量“殲-35A”發(fā)文詆毀 專家:行為藝術(shù),極不專業(yè)

      美軍企創(chuàng)始人用卷尺量“殲-35A”發(fā)文詆毀 專家:行為藝術(shù),極不專業(yè)

      環(huán)球網(wǎng)資訊
      2026-02-06 22:39:17
      廣西壯族自治區(qū)河池市人大常委會(huì)原黨組書記、主任潘育偉接受審查調(diào)查

      廣西壯族自治區(qū)河池市人大常委會(huì)原黨組書記、主任潘育偉接受審查調(diào)查

      界面新聞
      2026-02-07 17:07:32
      我國(guó)成功發(fā)射可重復(fù)使用試驗(yàn)航天器

      我國(guó)成功發(fā)射可重復(fù)使用試驗(yàn)航天器

      界面新聞
      2026-02-07 12:38:37
      特朗普:預(yù)計(jì)到我本屆任期結(jié)束時(shí) 道指將站上10萬(wàn)點(diǎn)

      特朗普:預(yù)計(jì)到我本屆任期結(jié)束時(shí) 道指將站上10萬(wàn)點(diǎn)

      財(cái)聯(lián)社
      2026-02-07 13:40:26
      懷胎7月孕婦與婆婆慘遭殺害,只因一條評(píng)論!行兇者:感覺受侮辱……多方發(fā)聲

      懷胎7月孕婦與婆婆慘遭殺害,只因一條評(píng)論!行兇者:感覺受侮辱……多方發(fā)聲

      上觀新聞
      2026-02-07 20:10:08
      因與人產(chǎn)生矛盾,持雙管獵槍射擊致對(duì)方1死1傷,山東菏澤69歲“黑老大”段效靈被執(zhí)行死刑,其組織和領(lǐng)導(dǎo)黑社會(huì)性質(zhì)多次故意殺人,犯罪69次

      因與人產(chǎn)生矛盾,持雙管獵槍射擊致對(duì)方1死1傷,山東菏澤69歲“黑老大”段效靈被執(zhí)行死刑,其組織和領(lǐng)導(dǎo)黑社會(huì)性質(zhì)多次故意殺人,犯罪69次

      大風(fēng)新聞
      2026-02-07 18:17:28
      難以置信!成都一小區(qū)拉出橫幅:這里都是黑旅館,入住安全無(wú)保障

      難以置信!成都一小區(qū)拉出橫幅:這里都是黑旅館,入住安全無(wú)保障

      火山詩(shī)話
      2026-02-07 16:21:22
      米蘭冬奧會(huì)開幕式爭(zhēng)議:烏克蘭獲熱烈歡呼!以色列亮相遭巨大噓聲

      米蘭冬奧會(huì)開幕式爭(zhēng)議:烏克蘭獲熱烈歡呼!以色列亮相遭巨大噓聲

      念洲
      2026-02-07 07:46:06
      中國(guó)股市——2026年極具翻倍潛力的牛股名單!

      中國(guó)股市——2026年極具翻倍潛力的牛股名單!

      道說(shuō)有財(cái)
      2026-02-07 14:59:37
      特朗普想搞“五國(guó)集團(tuán)”:由美國(guó)、中國(guó)、俄羅斯、印度和日本組成,取代七國(guó)集團(tuán)

      特朗普想搞“五國(guó)集團(tuán)”:由美國(guó)、中國(guó)、俄羅斯、印度和日本組成,取代七國(guó)集團(tuán)

      揚(yáng)子晚報(bào)
      2026-02-07 15:20:27
      年會(huì)蘋果機(jī)變瓷磚后續(xù)!同事曝主任早有預(yù)謀,公司處罰結(jié)果曝光

      年會(huì)蘋果機(jī)變瓷磚后續(xù)!同事曝主任早有預(yù)謀,公司處罰結(jié)果曝光

      離離言幾許
      2026-02-07 10:00:08
      太突然了!臺(tái)積電董事長(zhǎng)會(huì)見高市早苗,臺(tái)國(guó)民黨:“硅盾”沒了!

      太突然了!臺(tái)積電董事長(zhǎng)會(huì)見高市早苗,臺(tái)國(guó)民黨:“硅盾”沒了!

      青青子衿
      2026-02-06 02:49:02
      萬(wàn)斯抵達(dá)米蘭參加冬奧會(huì)之際 當(dāng)?shù)孛癖娍棺h示威

      萬(wàn)斯抵達(dá)米蘭參加冬奧會(huì)之際 當(dāng)?shù)孛癖娍棺h示威

      看看新聞Knews
      2026-02-07 11:11:38
      許家印害慘3位女人:1個(gè)虧百億、1個(gè)被全球追債,白珊珊最冤

      許家印害慘3位女人:1個(gè)虧百億、1個(gè)被全球追債,白珊珊最冤

      社會(huì)日日鮮
      2026-02-07 13:01:20
      打虎!徐一丁被查

      打虎!徐一丁被查

      新京報(bào)
      2026-02-07 20:18:09
      蘋果變瓷磚后續(xù):同事曝內(nèi)幕,提前調(diào)包早有預(yù)謀,涉事人恐遭重罰

      蘋果變瓷磚后續(xù):同事曝內(nèi)幕,提前調(diào)包早有預(yù)謀,涉事人恐遭重罰

      離離言幾許
      2026-02-07 13:30:06
      徐彬留洋處子秀首發(fā)!迎戰(zhàn)伊普斯維奇U21,獲教練組認(rèn)可

      徐彬留洋處子秀首發(fā)!迎戰(zhàn)伊普斯維奇U21,獲教練組認(rèn)可

      奧拜爾
      2026-02-07 19:32:46
      震驚!網(wǎng)傳扶著橋上燈桿的僧人還是跳下去了,事件真相浮出水面…

      震驚!網(wǎng)傳扶著橋上燈桿的僧人還是跳下去了,事件真相浮出水面…

      火山詩(shī)話
      2026-02-07 15:03:47
      臺(tái)媒曝趙薇離婚內(nèi)幕:前夫出軌女兒老師 生私子要她凈身出戶

      臺(tái)媒曝趙薇離婚內(nèi)幕:前夫出軌女兒老師 生私子要她凈身出戶

      議紀(jì)史
      2026-02-06 19:05:03
      6天虧光90萬(wàn),我勸普通人別做夢(mèng)

      6天虧光90萬(wàn),我勸普通人別做夢(mèng)

      最人物
      2026-02-06 15:53:05
      2026-02-07 20:44:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12131文章數(shù) 176373關(guān)注度
      往期回顧 全部

      科技要聞

      小米千匹馬力新車亮相!問(wèn)界M6雙動(dòng)力齊報(bào)

      頭條要聞

      日媒狠批特朗普干涉日本內(nèi)政:前所未有 不可容忍

      頭條要聞

      日媒狠批特朗普干涉日本內(nèi)政:前所未有 不可容忍

      體育要聞

      主隊(duì)球迷唯一愛將,說(shuō)自己不該在NBA打球

      娛樂(lè)要聞

      何超欣說(shuō)和何猷君沒競(jìng)爭(zhēng),實(shí)力遭質(zhì)疑

      財(cái)經(jīng)要聞

      金價(jià)高波動(dòng)時(shí)代來(lái)了

      汽車要聞

      工信部公告落地 全新騰勢(shì)Z9GT煥新升級(jí)

      態(tài)度原創(chuàng)

      旅游
      本地
      時(shí)尚
      游戲
      公開課

      旅游要聞

      黑龍江鐵力:冰雪文旅多點(diǎn)發(fā)力 燃動(dòng)冬季出圈出彩

      本地新聞

      圍觀了北京第一屆黑色羽絨服大賽,我笑瘋了

      今日熱點(diǎn):《驚蟄無(wú)聲》終極預(yù)告;韓國(guó)翻拍《解憂雜貨店》……

      在Warframe玩家見面會(huì)上,有最可愛的創(chuàng)作者和玩家

      公開課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版