金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
天下苦把控AI生圖細節久矣。
即便強如Nano Banana Pro,也會出現一致性不可控的情況。
例如我們三張毫無關聯的圖“喂”進去,讓它們做一個融合,結果可能是這樣的:
![]()
Emmm……確實不是我們理想中的那種效果。
但到了國產AI這里,畫風就完全不一樣了,我們還是用同樣的圖片和Prompt:
![]()
構圖、人物、電腦品牌,這回的“味道”是都對了,而且還是4K高清的那種:
![]()
這個國產AI,正是來自生數科技Vidu,剛才我們用到的功能便是基于Vidu Q2的參考生圖。
而且時隔僅僅三個月,Vidu參考生圖功能再次迎來升級,并且還號稱業界最強一致性:即使是反復編輯,多個主體仍然保持人物、物體的一致。
不僅如此,Vidu這次還全新上線了文生圖圖像編輯功能,一句話就能言出法隨,堪比嘴遁版的PS。
值得一提的是,在最新的AA榜單中,Vidu首次發布的圖像編輯功能首次參與即位列第四,超越OpenAI,并且可以跟Google、Bytedance大廠比肩。
![]()
劃重點:是限時無限免費的哦~
據了解,Q2文生圖、參考生圖、圖像編輯功能限時1個月會員免費,旗艦版會員生圖無限量,標準版和專業版每月享300張免費生圖,還不快去薅羊毛!
可以說是國產Banana平替,性價比高,生成速度更快,并且構建了一站式從參考生圖-參考生視頻的工作流,對創作者來說更加實用,據悉API也已同步上線。
那么全新發布的Vidu Q2生圖功能到底好不好用?
老規矩,一波實測,走起~
參考生圖的一致性,挺夠打的
首先,我們繼續來實測一下新升級的參考生圖功能。
據了解,此次Vidu Q2參考生圖在空間想象力和一致性上有了大幅進化,同時可以參考的元素更多,不僅能參考人物、物體,還能參考動作、位置、布局、紋理、光線、色調等等,可以說沒有什么是Q2參考生圖不能一鍵復刻的,關鍵是還能做到1:1還原,一致性這塊算是狠狠拿捏了。
這一次,為了測試主體的一致性,我們先生成一張主圖,再生成2個不同畫風的主角圖來做替換。
![]()
Prompt依舊很簡單:
- 將圖1中的人物替換成圖2和圖3。
![]()
我們先來看下Vidu Q2生成的效果:
![]()
不難看出,原圖中除了兩位人物被替換之外,其余的細節元素均沒有發生任何的改變;而且也和我們給到的新人物圖保持了高度的一致性。
再來看下Nano Banana Pro的結果:
![]()
雖然人物也是做到了一致性,但原圖的背景、結構以及圖片的比例卻發生了較大的變化。
接下來,我們繼續實測一把,看看四張圖能否毫無違和感地融合到一起。
這次的任務就是把下面的落地燈、掛畫和毛絨玩具,精準地塞進房間里,Prompt如下:
![]()
從生成的結果來看,Vidu Q2參考生圖不僅保持了落地燈、掛畫和毛絨玩具的原貌,也精準地放置到了我們預期的位置;而且也會按照符合物理規律地來調整角度和燈光等細節。
![]()
再加大難度——直接五個主體!
![]()
即便是這么多的主體,一致性這一塊,Vidu Q2依舊是穩穩拿捏住了:
![]()
如果說Vidu Q2參考生圖體現了業界領先的一致性的能力,那么全新的文生圖功能可以說是把創作者的想象力給打開了。
例如簡單一句話就可以生成四宮格漫畫
- 浦澤直樹漫畫風格,四宮格漫畫。
![]()
Prompt再細致一些,我們就會得到一張超有藝術感的小貓咪:
- 極簡內發光插畫,磨砂玻璃材質,一只貓的側臉仰望,閉眼安靜溫柔,身體如透明雕塑般從內部透出光暈,淡淡藍色與橙紅色漸變交織,內部暖光柔和流動,畫面空靈,深藍或者黑色背景。
![]()
除了升級的參考生圖和全新的文生圖之外,圖片編輯,也是此次Vidu的一大亮點。
編輯圖片比PS都方便
以往我們在用AI生成固定比例的圖片之后,有一個非常實在的問題,就是無法一張圖用在需要不同比例的多個場景。
但隨著Vidu推出的圖片編輯功能,這個問題已經有了很好的解法,而且還是一句話的事。
例如先用文生圖功能生成一張9:16的國漫風少女,在輸出結果的下方會有一個“快速編輯”的按鈕:
![]()
然后我們就會進入到編輯界面,輸入欄下方會有多種比例的選項:
![]()
無需輸入任何Prompt,圖像在不改變場景和風格的情況下,秒變成16:9。
![]()
除了這種方式之外,我們在參考生圖功能下,也可以輕松改變圖片的比例。
![]()
![]()
如此一來,以后的AI生圖可以真正的做到一圖多用,各種社媒、傳播渠道,宣傳、封面、營銷、廣告、豎屏短劇、橫屏統統都能滿足。
而這兩種編輯圖片的方式不僅可以用來改變圖片比例,更重要的,它還能像PS般修改圖片細節!
還是以剛才的圖片為例,只要一句話我們就能把圖片從白天變成晚上:
- 把圖1變成夜景,保持畫面整體的場景和風格不變。
![]()
還是一句話,就可以改變人物衣服的顏色:
- 把圖1女子衣服的顏色變成藍色,保持畫面整體的場景和風格不變。
![]()
如此一來,我們不需要再去死記硬背PS繁瑣的操作流程,通過自然語言也能超自然地修圖。
方便,著實是有點方便。
一站式「多參工作流」,簡直太實用了
不過提到方便,就不得不再提一嘴Vidu提供的一站式多參工作流了——
不論是生圖、生視頻亦或是保存主體,統統都在一個界面搞定,無需頻繁切換平臺。
![]()
例如剛才的國漫風少女,我們就可以在同一個界面里先一鍵保存為主體
![]()
再點擊“切換至AI視頻”→選擇“參考生視頻”→“主體庫”,就可以快速選擇對象,并附上一句Prompt:
- @古風漫畫女子隨風自然轉動身體。
簡單幾步,從圖到視頻,就這么水靈靈地一站式完成了:
![]()
視頻地址:https://mp.weixin.qq.com/s/ic93isA8mdAmKmw102lNUA
那么接下來的一個問題是,有了這些功能和便捷的操作方式,我們能用來做什么?
答案或許就是:AI生圖、AI生視頻,可以拿來商用了。
例如最近大火的變裝視頻,我們在上面種種功能的加持下,在5分鐘時間里就能搞出這么一個效果來:
![]()
視頻地址:https://mp.weixin.qq.com/s/ic93isA8mdAmKmw102lNUA
由此可見,Vidu已經是把AI內容生成的試錯成本和門檻狠狠地打了下去,這也是非常與當下技術發展的大趨勢極為契合——
從比拼大模型性能,到比拼誰家應用更好用、更便宜;一言以蔽之,好用才是硬道理
最后,體驗鏈接放下面了,感興趣的小伙伴快去試試吧~
Vidu地址:
https://www.vidu.cn/
量子位粉絲特別福利,使用邀請碼:QBITAIQ2,注冊即送100積分哦~
— 完 —
量子位 QbitAI · 頭條號
關注我們,第一時間獲知前沿科技動態
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.