這次去WAIC,論壇、探展直播、活動等等,硬生生干了個周末,幾乎累麻了。
我自己這兩天印象最深的,也是我覺得對我最有用的。
還是可靈的更新。
他們首發(fā)了1個全新的功能,靈動畫布,還把之前的多圖參考做了巨幅升級。
這兩都挺酷的。
我當時在現(xiàn)場,錄了一下靈動畫布的發(fā)布,真的,發(fā)完以后底下掌聲雷動。
這個形態(tài)我當時看完以后,眼前一亮,確實非常的有意思。
特別是對于AI創(chuàng)作者來說。
當時論壇結束以后,我問他們啥時候能用,他們說一會閉館了我們晚上回去讓產品給你開,但是你要是急的話,可以去樓上的可靈展區(qū)先試試看。
然后我就去樓上了。
給我看懵逼了。
我拍了一下當時的展區(qū)的盛況。
![]()
根本就特么擠不進去,我說我還是等你們晚上給我開吧,就掉頭回酒店了。
晚上的時候,他們給我發(fā)了一句,可以用了。
果然,我登上去,發(fā)現(xiàn)已經開好了。
靈動畫布在工具欄的最左邊。
![]()
點進來之后的界面,是這樣的。
![]()
其實你能看到,最大的三個功能,就是以模態(tài)為劃分的,圖片生成、視頻生成、音效生成。
這個界面你可以先不用管,我們隨便點開一個,比如圖片生成。
![]()
進去以后,你會發(fā)現(xiàn),自己來來到畫布界面,出現(xiàn)了節(jié)點。
左邊是Prompt輸入框,右邊是可以選擇的參數,比如模型、比例、多少張之類的。
中間用一個線給鏈接起來。
你只需要點一下立即生成。
他就會拉出一條新的線,鏈接到一塊新的卡片上,而這些卡片,就是圖片的生成結果。
![]()
大概幾十秒以后,四張圖生成出來了。
![]()
接下來,就是靈動畫布這種畫板式的產品,最棒的一點了。
在傳統(tǒng)的可靈的UI界面里,如果我們想把可靈生成的圖,用圖生視頻的方式生成AI視頻的話。
需要點擊這個生成視頻。
![]()
然后帶著這張圖,跳到了視頻生成的界面。
![]()
在對著一堆的按鈕和參數,調完以后,生成視頻。
但是我們都知道,做一個AI視頻的片子,可能需要幾百張圖,幾百個視頻。
就這么來回跳來跳出,人會跳成智障,感覺自己是個跳跳虎,你很容易就迷失了,忘了自己的素材在哪里。
特別是所有的生成結果都堆在右邊的結果欄里,圖和視頻混著排,我不知道你們,我自己是真的經常干著就找不到我之前的內容在哪了。
而在靈動畫布里,就天然的適合做這種任務。
同樣的,你可以把鼠標放在視頻生成上,然后單擊,就會出來兩個關聯(lián)的節(jié)點,這時候,這張圖片自己本身和文本就作為素材節(jié)點,再加上參數節(jié)點,點擊生成以后就可以直接生成視頻。
![]()
在這里面,你就可以切換模型,切換生成類型,還有一些幾條、幾秒等參數。
而新升級的多圖參考,也在這個里面。
![]()
素材節(jié)點+參數節(jié)點,就可以得到我們的視頻生成結果。
同時,這個視頻生成結果本身也是一個素材節(jié)點,后續(xù)可以用文本輸入+視頻參考的形式,給這個視頻去加音效。
我們需要用到的,主要就是節(jié)點之間的排列組合。
比如文本輸入+參數節(jié)點生成圖片,比如圖片&文本輸入+參數節(jié)點生成視頻,或者文本輸入+參數節(jié)點直接生成視頻。
其實底層邏輯和可靈之前的用法都是一樣的,但是不同的是,它把每一個工作的節(jié)點拎了出來,讓你在這個畫布上就能夠實時查看你的每一步工作。
我們還可以,微調Prompt,并行的開跑好幾個任務,之前我經常這么干,就是為了要一個最好的效果,而現(xiàn)在,在畫板上,并行會比傳統(tǒng)的UI直觀非常多。
![]()
這個并發(fā)的感覺,究極壯觀,強迫癥患者表示爽飛了。
2分鐘左右,視頻跑完了,你還可以,給他們加音效。
最后,從文字到圖片到帶有音效的視頻,就成了一個流。
![]()
而且這個畫布是無限的,也就是說,你在上面鋪開一整個短片分鏡也沒關系。
如果畫布太大,在畫布上迷路了咋辦?沒關系,右下角可以縮放,隨時會隨時提示你正在什么地方。
![]()
如果你的畫布被弄得特別亂怎么辦?也沒關系,它有一個功能叫做整理畫布。
![]()
點擊一下,咻的一下,頁面又整潔了。
對于創(chuàng)作者來說,非常直觀、方便、快捷,而且還極度可控。
我相信很多朋友其實都感覺到了,這玩意很像ComfyUI。
其實這種節(jié)點畫布式產品,越來越成為一種主流的交互形態(tài)了,比如ComfyUI、扣子、百度的自由畫布、Flowith等等。
這種形態(tài),我覺得解決了一個我一直認為的AI工具生態(tài)化的核心難題。
產品間的孤島化。
過去幾年,其實AI工具發(fā)展得非常迅猛,但用戶的體驗卻越來越破碎。
還記得2024年,我們生圖用Midjourney、生視頻用可靈、TTS用hailuo,生成完音頻以后再扔回可靈做口型驅動,實在是太操蛋了。
標簽上永遠開著十幾個網頁。
也是后來我是在忍不了來回切換,搞了一個49寸的巨長無比的顯示器,直接人工把所有的工具變成了節(jié)點式顯示器畫布,5、6個網頁并排排列。
這邊生成的素材我下載下來,然后傳到另一個產品里面,然后生成完再下載下來上傳到另一個地方,效率有提高,但還是難受。
節(jié)點式畫布直接打通了這種孤島,把多個不同工具和功能真正整合成了一個平臺級的生態(tài)。
而且因為我自己是UI設計師出身,在很久以前就在用畫布式的工具,比如Sketch、Figma、AI(Adobe那個AI)等等,其他大家也有一個很棒的點。
就是,我們真正在創(chuàng)作的時候,其實不是線性的。
創(chuàng)作一直是一種非線性、網狀的拓撲結構。
我們的靈感并不是順序產生的,而是隨機、并發(fā)、發(fā)散出現(xiàn)的。
而這種產品形態(tài),本身就非常的契合創(chuàng)作本身。
而可靈本身有生態(tài)級優(yōu)勢,圖片、視頻做的很棒,做這種進一步的創(chuàng)作工具,本身就是水到渠成的。
靈動畫布上,還有一些小細節(jié)。
比如底下這個對話框,我在對話框里寫一句提示詞,點右邊這只小筆,它就可以給我優(yōu)化提示詞。
![]()
我在這個框里寫了一句生成一只金毛犬,這是它刷刷刷給我寫的,還直接給出了任務節(jié)點:
![]()
生成好的結果那一欄,也會有添加到對話框的選項。比如我生成了一張圖片,就可以添加到對話框里,讓它再做參考。
說實話,這比我之前用可靈要省事太多了,不用翻歷史創(chuàng)作天荒地老,要什么東西直接一拖畫布,就拿到了。
還有首尾幀,你把兩張圖直接拖進去,一框選,就可以直接生成首尾幀視頻,或者直接多圖參考生視頻,也行。
![]()
而且這個靈動畫布,還可以多人協(xié)作,點擊右上角的分享,就可以把自己的畫布分享給別人。
也可以輸入協(xié)作者的ID來添加協(xié)作者。
![]()
目前最多能加五個協(xié)作者,對于一個短片來說,已經很夠用了。
可以看到,可靈AI現(xiàn)在越來越想往生態(tài)、專業(yè)上去做出一些定義了。
并且因為內測中,所以還有很多功能不全,我整理羅列了一下。
![]()
除了靈動畫布之外,還有一個新升級的就是多圖參考。
可靈的多圖參考生視頻是今年一月份出的,現(xiàn)在又來了一波更新,也可以直接在畫布中使用。
![]()
這次多圖參考的升級,主要就是人物和角色更自然、一致性也更強了。
同時支持4張圖。
并且,可以參考部分區(qū)域。
![]()
可以參考主體,可以只參考面部、服飾等等。
讓參考更加的精準。
我們用這個功能,玩很多的花活。
比如,肌肉男在麥當勞中舉著卡皮巴拉深蹲。
![]()

比如,讓大衛(wèi)和女孩一起在花園里散步,畫風保持的非常完美。
![]()

比如,兩只貓一起玩毛球。
![]()

非常的有意思。
用多圖參考,保證一致性,我覺得才是用AI來做故事的起點。
除了多圖生視頻之外,多圖生圖也有很多花活。
在圖片生成一欄,點參考生圖——多圖參考,就能看到主體、場景和風格三個生圖維度了。
![]()
這個界面,有點眼熟之前Google的whisk,都是依據主體 - 場景 - 風格來出圖,不過可靈的自由度還要更高。
whisk每個維度只能放一張圖,但可靈的主體這欄足足可以放四張圖。
我直接用它生成了一個拼好飯的升級版,拼好購。
![]()
![]()
還有喜聞樂見的邪門cp修羅場大亂燉。
![]()
![]()
賊好玩。
做幾個case我覺得也不是特別有意思,于是,有了一點小想法,我就花了一下午和一晚上的時間,用靈動畫布和多圖參考,做了一個小片子。
一個模特女孩的一天。
在多圖參考生的模式下,一致性會強到非常離譜。
我寫完這篇文章的時候,已經凌晨兩點了。
我看了眼屏幕上的靈動畫布,滿滿當當的節(jié)點里堆滿了我這一晚上的奇思妙想,突然有種莫名的滿足感。
或許,我們距離真正的無限創(chuàng)作時代。
又更近了一步。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.