作者|子川
來源|AI先鋒官
快手帶著大家伙來了!
12月1號,可靈AI突然放出一個重磅消息——推出了O1模型。
官方稱其為"全球首個統(tǒng)一多模態(tài)視頻模型"。
從官方給出的介紹來看,這次可靈O1的核心亮點在于把文生視頻、圖生視頻、視頻編輯、內(nèi)容增刪、風(fēng)格變換等一大堆功能,全部集成到一個統(tǒng)一的模型里。
以前我們用AI視頻工具,基本都是這樣的:想文生視頻,就去文生視頻的入口;想圖生視頻,就得切換到圖生視頻功能;想編輯視頻,又得找視頻編輯工具。
每個功能都是獨立的,切換起來麻煩不說,效果還不一定連貫。
但可靈O1不一樣,它把這些功能全部融合到一個模型里。
你上傳一張圖片、一段視頻,或者直接輸入文字描述,模型都能理解你想干什么,然后直接給你生成出來。
更厲害的是,這個模型還結(jié)合了Chain-of-thought技術(shù),也就是思維鏈推理能力。
這意味著它不僅能理解你的指令,還能像導(dǎo)演一樣記住主角、道具和場景,無論鏡頭怎么切換,主體特征都能保持一致。
說了這么多理論,那實際效果到底怎么樣?下面我們來試玩一番。
視頻內(nèi)容增刪是可靈O1最讓人驚喜的功能之一。
你可以在視頻中任意增加或刪除內(nèi)容,比如給角色添加一件衣服、消除路人、增加道具等等。
比如上傳一個女生打傘的視頻,但是我需要去除這把傘,效果是這樣的——
原視頻
可以很清楚地看到,原視頻中的傘被刪除掉。而且視頻的一致性保持的相當(dāng)出色,除了傘以外,其他都沒有任何變化。
不過也會去除不完整的情況出現(xiàn)。
像下面這一段,原本視頻中有一只小兔子。
![]()
把它刪除效果是這樣的,細看可以看出兔子原有的位置扣除的并不干凈。
除了增刪,可靈O1還能修改視頻中的特定部分。比如你想把角色的衣服從紅色改成藍色,想把夏天的場景變成冬天,或者給視頻加上特效,都能輕松實現(xiàn)。
比如把原有視頻中的形象進行替換。
原視頻
一致性的效果依舊出色,這次我們可以用蠟燭作為參考物,原視頻的蠟燭燃燒的狀態(tài)和修改后視頻的一致的。
還能把騎自行的車傻狍子換成一只兔子。
![]()
不過也有失敗的案例,比如左側(cè)的杯子憑空長出了一條尾巴。
同時你還可以在原有視頻中增加一些元素,比如在跳舞女孩的后面添加一個外星人。
還有之前很火的風(fēng)格轉(zhuǎn)換可也以在可靈O1中完成。
把風(fēng)景視頻轉(zhuǎn)換成日本動漫風(fēng)格。
整體體驗下來會發(fā)現(xiàn),可靈O1提供了統(tǒng)一的Omni界面,支持圖片、視頻、主體等多模態(tài)輸入。整個操作流程非常簡單,學(xué)習(xí)成本比較低。
同時在實際體驗過程中發(fā)現(xiàn)可靈O1在某些復(fù)雜場景下可能還會有一些瑕疵,但這種"大一統(tǒng)"的設(shè)計理念,很可能會成為未來AI工具發(fā)展的方向。
畢竟,誰不想要一個能解決所有問題的全能工具呢?
目前可靈O1已經(jīng)全量上線,感興趣的可以去體驗一下。
掃碼邀請進群,我們帶你一起來玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學(xué)一些AI搞錢技能。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.