早上我給朋友發(fā)了一張圖片,他驚訝地問我,你去字節(jié)上班了?
這張圖片是這樣的。
![]()
怎么樣,是不是毫無違和感?
別驚訝,開個玩笑,上班是不可能上班了,但 AI 可以幫我搞一張大廠體驗卡。
如果我告訴你,這張字節(jié)工牌是由下面兩張圖片生成的,我沒有用 PS 魔法,只是簡單給 AI 提了一個需求。
![]()
最近我每天使用 AI 產(chǎn)品的頻率高了很多,也把很多 AI 產(chǎn)品應(yīng)用到了工作和生活中,有時候也會拿來玩一玩。
如果你還只是關(guān)注 AI 但還沒有上手 AI,我的建議是,盡快動手。
前陣子在朋友介紹下體驗了字節(jié)的即夢 AI 新版本,準(zhǔn)確說是他們的新模型 Seedream 4.0。
即夢 AI 4.0 的主要特性是支持多圖參考和組圖生成,跟之前我介紹的 Nano Banana 能力類似。
我總共試驗了不同場景下的需求,怎么說呢,沒那么滿意,但也不至于很失望。
先說幾個成功的案例。
我的第一個需求是將下面兩張照片合并成一張,提示詞是「把圖片中拿鏟子的小孩和另外一張圖里的大人放在一起,兩人并排站著看遠(yuǎn)方的湖泊」。
![]()
選擇 Seedream 4.0 的模型,經(jīng)過即夢 AI 的造夢后生成了一組圖片,我從中選擇了一張效果比較好的。
![]()
相較于原圖來說,AI 生成的圖對我的原圖做了光影優(yōu)化,更加還原了我所穿衣服的顏色。
另外,合成后的圖片里,參照了小小唐所在圖中的湖水顏色,而且水中還有天上云朵的倒影,岸邊鹽湖的質(zhì)感也呈現(xiàn)了出來。
原圖所在的地點是青海茶卡鹽湖,看來 AI 識別出來了。
再看一張我覺得效果不錯的。
![]()
這張是把小小唐所在原圖中對岸的小火車和人群元素加了進(jìn)來,并且讓他站在我原本站的臺階上,而我站在了臺階下。
再看一個我覺得也算成功的案例,原圖是下面這張。
![]()
我的需求是把圖中的黑車變成白車,然后加上車牌號,提示詞是「把圖中的車輛換成白色,加上綠色新能源車牌,車牌號是“湘AFV0304”」。
看下結(jié)果。
![]()
車漆是換成功了,但車頂好像還是黑色,而且車牌的中文字有點歪曲。
接下來我又給它上了點難度,在原來提示詞的基礎(chǔ)上增加一個黑白雙拼車身的需求。
![]()
這次車頂也被修改成白色了,而且雙拼車漆的效果看起來也不錯,車牌也正確。
好,接下來就看其他失敗的案例,先看下面兩張原圖。
![]()
我輸入的提示詞如下。
![]()
不知道是我提示詞的問題還是照片比例問題,生成結(jié)果中我的人物比例都是偏大的。
而且,我的面部全部都糊掉了,就像一個巨人一樣站在臺上。
![]()
不過整個人物倒是摳出來了,而且手部動作也到位。
后來又調(diào)整了一下提示詞重新生成了一組圖片,雖然在其中找到了一張人物比例正確的,但是臉部依舊是糊的。
有趣的是,這次的結(jié)果中把我的照片搞到后面屏幕的 PPT 里去了,關(guān)鍵是臉部竟然沒糊。
![]()
接著看,我在網(wǎng)上找了一套衣服的圖片,希望把這套衣服穿在左邊我的照片上。
![]()
我從生成結(jié)果里找了一張相對靠譜的,衣服是穿上去了,但臉又糊了,已經(jīng)不怎么像我了。
![]()
神奇的是,AI 竟然把我光腿的樣子想象了出來,還別說,腿型和我真像,連腿毛都有刻畫。
然后我又給即夢 4.0 提了個需求,讓它以我這張照片為主題,生成一個包含 4 個畫面的分鏡頭,并配上字幕。
![]()
提示詞我是這么寫的「以圖中人物為主題,生成一組工作場景分鏡,主題是一個字節(jié)跳動的產(chǎn)品經(jīng)理和程序員在針對一個需求的討論,場景設(shè)定在會議室,總共出 5 張圖片,每一張圖下方都要配上中文字幕」。
然后,我得到了這 5 張圖片。
![]()
![]()
![]()
![]()
![]()
5 組分鏡倒是生成了,但還是前面的問題,臉糊掉了,而且表情和五官非常怪異。
另外,第三個分鏡中我和程序員的衣服竟然對調(diào)了,果然是穿一條褲子的難兄難弟。
除此之外,場景和情節(jié)構(gòu)建倒是挺像那么回事兒。
不管怎么說,AI 算是把我在字節(jié)的「工作照」給弄了出來。
既然即夢 4.0具備一定的推理能力,于是我讓它針對一個產(chǎn)品線框圖做高保真原型。
這是線框圖原圖。
![]()
提示詞是這樣的「把這張產(chǎn)品線框圖渲染成高保真原型,風(fēng)格選擇京東紅,保證設(shè)計規(guī)范的一致性,要求視覺美觀,文案正確」。
看結(jié)果。
![]()
從生成的結(jié)果來看,不能說一點不對,但也基本是沒啥用。
當(dāng)然,可能這個問題可能有點超綱了。
到目前為止我嘗試過的場景需求中,能稱得上結(jié)果令人基本滿意的只有前面兩個,成功率并不高。
至于字節(jié)有沒有搞砸,我覺得還需要留一些時間給他們進(jìn)化。
可能是我的使用方式不對,也可能是提示詞不精準(zhǔn)或者題目太難,總之沒達(dá)到預(yù)期。
當(dāng)然,如果只是玩一玩基本也夠了,但如果要放在生產(chǎn)領(lǐng)域那就還差點火候。
不過我還是看到了一些實際應(yīng)用空間,
比如,假設(shè)在裝修設(shè)計環(huán)節(jié)我想對這個原圖的布局做一些調(diào)整,提示詞是「把這張圖片中客廳里的電視換成投影儀屏幕,地毯換成淺藍(lán)色,客廳頂部的燈換成吊頂圓燈」。
![]()
過去,可能需要設(shè)計師重新調(diào)整并再出一版方案。
現(xiàn)在,用 AI 進(jìn)行快速重構(gòu)并給客戶進(jìn)行演示的話,效率還是提高很多。
![]()
在上面的 AI 出圖中,除了投影儀的位置有問題,其他部分的改動需求 AI 都完整做到了。
除此之外,像廣告創(chuàng)意、產(chǎn)品演示、服飾搭配、裝修效果展示等場景都可以用到。
即夢 AI 4.0 倒是讓我看到了未來的一種創(chuàng)意方式,那就是把想象力變成現(xiàn)實的工具。
只要你有想法,你要你能準(zhǔn)確描述,剩下的就可以交給 AI。
因此,豐富的想象力和精準(zhǔn)的表達(dá)力,這依舊是我們作為人的優(yōu)勢,也是把 AI 當(dāng)做工具更好使用的杠桿。
類似即夢 AI 或者 Nano Banana 這樣的工具是普通人都可以上手的,如果你過去因為不懂 PS 而難以下手,那現(xiàn)在只要你會說話就可以拿起 AI 的調(diào)色盤。
說到這我倒是覺得即夢的產(chǎn)品定義非常好,造夢。
電鋸在手,就不要惦記錘子了。
················· 唐韌出品 ·················
安可時刻
最近我繼續(xù)在小報童上更新 AI 基礎(chǔ)技術(shù)知識專欄,用通俗易懂的方式講解 AI 技術(shù)背后的原理,幫助不懂技術(shù)的同學(xué)了解基礎(chǔ)原理和邏輯。
目前 AI 章節(jié)已經(jīng)更新了十幾個知識點,我爭取保持每周更新,其實也是對我學(xué)習(xí)和實踐的一次總結(jié)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.