![]()
作者|魚丸
編輯|星奈
媒體|AI大模型工場
最近朋友圈被豆包Seedream 4.0刷屏了,一開始剛看那圖片,我以為又是朋友們在炫耀他們的3D模型,結果點進去放大一看水印不對啊,怎么變成豆包AI生成了呢。
立馬去搜了一下,好家伙,作為字節跳動9月9日剛發布的圖像創作模型,它號稱是“國內版NanoBanana",也不知道真有那么好玩嗎,說到這立馬上傳一張了圖片,誰說心中的白月光一定是人呢,也可以是一碗螺螄粉。
![]()
這圖片的色澤看著想流口水了,看來Seedream 4.0不簡單呢。
據了解這是Seedream 4.0首次支持4K多模態生圖,實現多圖融合創作,什么意思呢,就是之前上傳單一參考圖片的時代已經過去了,可以滿足更多樣更豐富的創作要求,并且能更準確的讀取和理解圖片文字要求,不僅如此在一致性上更是有很大提升,不論是搞笑創作還是進行商業用途,Seedream 4.0直接全包了。
現在Seedream 4.0已經上線豆包APP,大家可以玩起來了。
01
實測豆包Seedream 4.0,真正的六邊形戰士誕生了
1、創意周邊,從草稿到實體只需要一步
AI創作的一致性一直都是一個難題,其對于大模型的識別能力非常具有考驗性,但是這又是貫徹整個設計的重要要求,畢竟誰也不想生成圖片后發現可以應用的圖片為零。
表情包組合大家應該用的不少,但是有沒有想過設計一套屬于自己的表情包,上傳一張可愛起司貓的圖片,輸入要求:幫我創作一張圖片,圖片內包含表情、姿勢不同的九宮格表情包,原比例。
![]()
我的天!怎么可以這么可愛,萌化了,這我不得不要夸夸Seedream 4.0,每個圖片的表情都對應了不同的情緒,開心的,生氣的,無語的,圖片中的小貓臉也沒有改變畫風或是變成稀奇古怪的模樣。
這就是升級后的一致性,只需要上傳喜歡的圖片,一句話就能生成,而且每張圖片的形象基本上完全一致,在細節上小貓頭上的劉海的花紋都大差不差,剛開始測就已經想說豆包你是我的神!
再隨手畫一個貓咪涂鴉(忽略我的畫畫水平),看看豆包可以理解嗎,輸入”轉換成毛絨玩偶,放在真實的沙發上”。
![]()
![]()
這確定不是一個模子刻出來的嗎,畫風如此抽象怎么讓豆包生成之后怎么也變得可愛起來了。
不僅如此,隨手畫的胡子的長度和嘴巴的微笑弧度,完美復刻,并且把下方畫的很模糊的腿部也給補充完整,連布制沙發的紋理,小貓的影子都生成的一點都不突兀,看來豆包可以拯救我之前的廢畫了~
2、多圖合成,創意合照的神操作
除了上述可以傳一張圖外,還能上傳多張圖。單張參考圖的時代慢慢的被淘汰,多圖參考才是趨勢,多一張圖就代表多一種想法,就可以多完成一個任務,不過這并不是說單圖的參考生成就要敷衍,而且說不論是單圖還是多圖都能把握。
上傳兩張小狗的圖片輸入“讓圖1的狗和圖2的狗在草地上散步,原比例。”
![]()
![]()
挺好,兩只狗在肩并肩走路,金毛脖子上的鐵鏈子和小狗的藍眼睛都很寫實。
那讓我們再弄點抽象的,上傳李白和李榮浩的照片,想沒想過讓他倆同臺創作呢,輸入生成照片為寫實風,圖一的李白和圖二的李榮浩一起在演唱會舞臺上唱歌,李白在左邊拿著話筒,李榮浩在右邊唱歌,原比例。
![]()
![]()
好家伙,Seedream 4.0直接把李白的衣服給補全了,還帶有古裝的褶皺,和環境融合的一點違和感都沒有,就是有點懷疑豆包是不是把李榮浩的眼睛給偷偷變大了。
這都沒難倒豆包,再上點難度,再上傳一張手動操作的比耶的火柴人圖片,輸入“把右邊的人物動作換成圖二的動作其余不變,原比例。”
![]()
![]()
整體來說很不錯,非常準確的捕捉了抽象圖畫中的動作,并且除了動作改變外還保證了其它的特征不變,也沒有什么錯位混亂的問題和違和感。
不過有一點實錘,豆包真的把李榮浩眼睛變大了,豆包的另一個身份不會是李榮浩粉絲吧~
3、理解文字,風格轉變,小白也能秒變藝術大師
除了一致性外,理解能力也非常重要,提升自然語言的理解的準確度才可以滿足對應的需求。
聽說這次豆包Seedream 4.0不僅能聽懂字面意思還能自己推斷思考,用一個很簡單的方法。上傳一張冰塊的圖片,輸入半小時后會是什么樣子。
![]()
我們看到豆包Seedream4.0理解了半小時的時間概念,也知道半小時后冰塊會融化,雖說水確實有一些多,但是效果已經超出預料了。
再輸入“把這些冰塊放到一杯桃子汽水里,用透明杯子盛著。”
![]()
我們看到下方還有水汽融化的水漬,非常細節,最后再讓其轉變成卡通風,上面寫著桃子汽水。
![]()
太像電視里動畫片的小飲品,文字讀取也沒有差錯,幾句話豆包就把冰塊的一生都解決了,豆包Seedream 4.0已經是Next level了。
我們在讓豆包設計個簽名,上傳一張卡通女孩的圖片,輸入給魚丸設計一個簽名,并把簽名印到圖片右下方上,簽名瀟灑飄逸,原比例。
![]()
![]()
我們看到豆包的設計了一個金色漸變的筆跡,有點自己的想法,下方還有一些簽字的筆漬,非常細節了好像剛簽上的一樣。
4、商業實操,實用性才是第一要義
除了上述的一些創作,能夠在生產使用場景中得到運用也是很重要的,畢竟滿足生活創作和產業使用都是大模型不斷升級的推動因素,在各種領域都離不開創作。
下面讓我們設計一個城市宣傳圖,輸入用晶瑩剔透的3D創意字體設計,插畫海報,白色背景,文字“上海”,“上”字內筆畫嵌入上海的特色物品,“海”字內筆畫于海,特色建筑,體現了上海在城中、城在海中,高品質,2k。原比例。
![]()
不得不說,豆包是有審美的,并且在沒有明確指示的情況下還可以理解生成東方明珠,總體來說這個海報大氣美觀有特點。
我們再看看用一張圖片能不能解決商家的小問題,上傳一張小孩都喜歡的小蘭姐姐的圖片,輸入“根據這個圖片設計一套文具”。
![]()
![]()
從左到右依次是,本,筆,鉛筆盒,封皮,我們發現在頭飾上有些出入還有鉛筆盒上裙子上的細節,別的都沒有問題,小學生看到估計直接愛了。
然后我們來看看房屋設計圖,我們上傳三張平面設計圖,輸入要求“根據這三層參考圖,生成完整的房屋結構圖。原比例。”
![]()
看看最后效果:
![]()
整體三層樓,每個樓的數值和布局都完好的拼湊在一起,展現豆包Seedream 4.0了強大的場景重構能力。
最后看一下對于動漫的續寫和繪畫,上傳一張女孩停下自行車看小貓的圖片。
![]()
輸入根據這個圖片,續畫一下這個女孩騎車走向后面的樹林,比例 3:4。
![]()
我們發現豆包重新繪畫了騎車女孩的背影,以及把后面的背景換成樹林,把原圖背景被改變了,有些偏離了題意可能沒有深度理解“續畫”的意思。
02
豆包Seedream 4.0正在刷新AI設計新方向
總體來說,這次豆包Seedream 4.0給我很大的驚喜,如果只是單純被國產NanoBanana的名號吸引,那可能真的就錯過了太多好玩的功能。
即使在一些人物的細節和服裝還有要求理解上的精準度上有些欠缺,不過這恰恰也是未來努力的方向。并且在這次體驗中發現每次響應要求的速度很快,而且生成的圖片畫質高,在多模態理解能力上還有推斷能力,主體的一致性在不斷進步。
在操作上也沒有什么門檻,只要表明具體要求,豆包基本上都能理解。Seedream 4.0 模型已經在豆包、即夢上線,并通過火山引擎開放給企業客戶進行體驗。
豆包4.0也正在成為一個在不論是單圖參考還是多圖融合基于在語言圖片生成輸出的一一站式創作平臺,不斷提升創作的自由度。
不僅如此,從豆包Seedream4.0的提升上也不難發現,豆包在不斷的聽取用戶真實的聲音,在大模型設計這個行業里做真正的產品,不斷縮小國產AI和國外大廠的差距。
但是只要身處AI設計行業的競爭中,不斷的進行技術迭代升級,不斷的貼合真正的需求才能站穩腳跟。可能這就是豆包的初心,用技術激發更多的設計潛力,讓普通人也能完成屬于自己的創作靈感,這也是技術普惠的意義。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.