![]()
前幾天 Nano Banana Pro 玩瘋了吧,有沒有想過什么時候視頻模型也能有類似的能力。
現在,他來了。可靈發布了 O1,一個大一統的視頻、圖像生成和編輯工具,支持在一個界面和流程中完成你需要的全部視頻圖片編輯和生成工作。
總結一下這次更新內容:
統一多模態視頻大模型,把參考生視頻、文生視頻、首尾幀、內容增刪與風格重繪等任務融合,一站式完成從生成到修改。
支持圖片、視頻、主體與文字的多模態輸入,直接用自然語言進行精細編輯,無需遮罩或關鍵幀。
通過多視角主體與參考素材,保持角色、道具、場景的特征穩定與鏡頭間一致性,確保連貫畫面。
自由組合參考與指令,覆蓋運鏡、動作、鏡頭延展等復雜玩法。
可生成約 3–10 秒的自由敘事鏡頭,靈活控制節奏與鏡頭長度。
老規矩,先來看一個藏師傅關于這次相對重要的視頻編輯能力和多圖參考能力的演示視頻:
然后我會對這次新增的一些能力進行測試,同時大概教大家一下這個模式應該如何使用。
進到可靈頁面,你就會注意到左側新增了一個非常顯眼的圖標,用了這個后面那幾個界面你基本就用不著了。
![]()
進來以后就會發現下方的提示詞輸入框位置集成了非常多的選項,下方用來切換視頻和圖片生成的基礎操作,比如時間比例等,上方的幾個膠囊按鈕主要用來控制輸入內容的類型。
比如圖片主體參考這里他就會出現、視頻、圖片、主體三個輸入項,當然你可以刪除圖片或者主體,只用文本操作。
然后首尾幀這個輸入項就會變成首幀和尾幀,這個我們就熟悉了,不過提示詞也需要對首尾幀進行標注。
![]()
我們先來看一下最基本的通過文本進行視頻編輯,你只需要上傳需要編輯的視頻,然后在提示詞輸入框輸入提示詞的時候在指代素材那里@ 對應的素材就行。
![]()
然后你就看到你的視頻已經被修改了,比如這里我說的是穿上黑色風衣和帶上墨鏡,可以看到服飾的質感還是非常不錯的,干周圍環境融合的也很好,窗臺的陽光照在衣服上的高光也有。
可以看到嘴型和運動都可以遷移,所以你可以將 O1 當做數字人模型使用。
文本的修改搞完之后就是,圖片參考了,如果你不知道想要修改的環境或者角色具體怎么描述的話,當然可以上傳圖片讓他參考,支持單圖也支持多圖。
在提示詞書寫的時候需要注意,你是需要直接修改背景還是需要一個過渡,這兩個是不同的。
另外盡量詳細描寫背景的圖片運動方式或者一些前景會讓整個畫面顯得更加真實,比如我這里讓他在角色前面增加了藤蔓。
![]()
可以看到為了配合這種遺跡環境的結果,他還幫我把面部和身體的亮度變暗了,后面的角色也在運動都沒啥問題。
關于圖像參考這里有個技巧,你可以第一次通過一張圖片對視頻進行修改后,再次將修改后的圖片讓他修改,這樣可以最大程度確保對于視頻編輯的控制力度。
第一次修改抽卡直到有符合你要求的內容之后再進行第二次修改。
![]()
比如我上面這里,顯示讓他在我桌面上增加了最近比較火的瘋狂動物城的朱迪,然后在用剛才生成的視頻讓他向視頻中增加可靈 O1 的文字。
然后你可能一直好奇上面素材部分的主體是什么東西,這是這次 O1 新增的一個元素,簡單來說就可以理解為你創建的角色,常用角色創建后可以直接選擇,不需要頻繁上傳了。
![]()
點擊添加主體的圖標之后右側就會出現主體的選擇彈窗,官方內置了很多常見的主體類似可以讓你選擇。
![]()
你也可以點擊左側“我的主體”去創建主體,創建的時候我們就理解為什么都是圖片主體要單獨列出來了。因為它可以上傳多個不同角度的圖片,更大程度的提高角色、道具、場景在視頻生成中的一致性。
![]()
而且你還可以將多個主體疊加,如果你是要創作專業內容的話,我建議還是多創建角色和場景的主體,一致性表現確實比單張圖片要更好。
比如我這里選擇了將我自己改為林黛玉這個主體,同時還加上了天使之翼這個道具,這兩個完全不搭嘎,再加上我的室內環境同時包含了前景和背景,非常復雜了可以說。
但是視頻的融合度非常好,翅膀也會跟這個我的身體運動,光照的部分也沒啥大問題,真實感很高。
![]()
主體這玩意對于電商來說絕對是非常大的利好,再也不用擔心視頻一運鏡商品就跟原來的不像了,現在上傳四張圖片創建一個主體,隨便怎么轉都行。
![]()
可以看到我這里用我自己用的鼠標創建了一個主體,讓他讓他進行一個非常大的環繞運鏡。
產品展示的非常穩定,甚至鼠標上的劃痕和使用痕跡都沒啥變化,這個一致性保持的太強了。
提到了單純的主體生成視頻了,順便提一下,可靈 O1 在生成視頻的時候支持自由選擇 10 秒內的單條視頻生成時長了,而且會按時長扣除靈感值。
這個對于做視頻 Agent 產品以及一些輕度展示場景絕對是重大利好,相當省錢。
![]()
當然,O1 也可以直接轉變視頻的風格,我試了一下毛氈風格、動漫風格、8-bit 像素風格都沒啥問題,你直接跟他說將 XXX 視頻轉換為 XXX 視頻風格就行。
以前那些做起來成本很高非常復雜的風格轉換特效,現在非常簡單的一句提示詞就可以了。
O 1 依然是支持首尾幀生成視頻的,你可以點擊輸入框上方“首尾幀”來獲取素材上傳 UI,而且視頻編輯加上首尾幀能做出非常離譜的特效效果。
比如我上面演示視頻的最后一段就是先通過圖像參考的視頻編輯將手里的鼠標換成了代碼組成的龍,然后再將視頻最后一幀和代碼龍的圖片做了首尾幀視頻生成,搞定了一個非常大場景的轉換。
![]()
可以看到過渡非常自然,如果好好發掘一下的話估計可以搞定不少非常炫酷的特效類型。
說完了視頻我們來看一下 O1 圖片。
輸入框左下角切換為圖片就可以使用,支持上傳多張圖片以及加入對應的主體,和對圖片進行編輯。
先來一個多圖參考,搞一下最近很火的跟朱迪合影,這個其實相對復雜點,涉及到場景一致性、而且人物和動畫角色風格不太一樣。
抽了兩次卡,沒想到搞的還不錯,場景人物和朱迪都保持的不錯,而且兔子的原圖表情還比較夸張,他也修正了。
@圖片1 的角色和 @圖片2 的角色在 @圖片3 的場景親昵的合影
![]()
當然圖片也支持跟主體混合進行修改,同樣可以增強一致性,我這里將我自己換上了民國服飾主體,場景換到了辦公室這個主體,也還行。
![]()
好了這就是今天測評加 O1 簡單教學的所有內容了。
視頻領域,正在復刻圖片領域的發展路徑,更好的推理能力&世界知識,更強大的編輯能力,可靈視頻 O1 模型剛問世,效果已經相當可以了。
回想一下今年三四月的圖像編輯模型質量,再看最近短短半年的發展成果,只要起步了進展就會很快了。
如果你覺得今天的內容對你有幫助的話,可以幫我點個贊或者喜歡,也可以將這個內容推薦??給你覺得需要的朋友們。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.