作者|子川
來源|AI先鋒官
阿里不愧是凌晨的開源戰神!
昨日凌晨,當大家還在呼呼大睡時,阿里又雙叒開源了開源啦!
此次開源的主角是圖像編輯模型Qwen-Image-Edit,支持文字修改、風格遷移、背景替換、服裝修改等多種操作。
簡單來說,指哪改哪!
![]()
那這次效果到底怎么樣?老規矩,繼續我們的每日一測!
這次挑戰者是初出茅廬的Qwen-Image-Edit,而守擂方則是圖片編輯領域公認的最強王者——FLUX Kontex Max。
看阿里的新模型能不能抗住壓力。
由于FLUX.Kontext只支持英文提示詞,而Qwen-Image-Edit模型支持中英文提示詞,所以全程我們都采取的是英文提示詞。
測試一:文字修改
文字處理一直是衡量圖片編輯模型的一個重要指標。
上傳一張英文海報,將海報中的日期改成”2025.8.20“。
提示詞:Change the date in the poster to "2025.8.20"
原圖:
![]()
輸出結果如下:
![]()
FLUX Kontex Max Qwen-Image-Edit
結果如圖所示,兩者都是僅僅只是修改了日期,其他的元素絲毫沒變。
不過仔細看會發現,Qwen-Image-Edit 還悄悄把圖片顏色調得更鮮艷了,可能是模型自帶的優化。
增加一下難度,不僅修改日期,同時將海報上的字母”Fancy Fancy"修改成“Qwen”。
提示詞:Change the date in the poster to "2025.8.21" and the letters "Fancy Fancy" to "Qwen".
輸出結果如下:
![]()
FLUX Kontex Max Qwen-Image-Edit
難度上來了,差距就體現出來了,FLUX Kontex Max依舊穩如老狗,完美交卷。
反觀Qwen-Image-Edit則將字母”Fancy Fancy“修改成”Qwen Fancy",任務失敗。
后續我又試了3次,它才終于修改成功,看來,修改的文字一多,抽卡大法必須得安排上!
![]()
不過Qwen-Image-Edit有一項FLUX Kontex Max沒有的絕活——修改中文,這塊我們也進行了簡單測試了一下。
提示詞:將文字“恭賀新春”改成“端午安康”。
![]()
提示詞:將文字“玉樹臨風”修改成“大展宏圖”。
![]()
效果一個字:穩!在中文處理方面,Qwen-Image-Edit表現還是不錯的。
不過還是有一點需要改進的地方,就是修改后的字體和原來不一樣了,少了一些藝術感。
測試二:視覺轉換
這個環節考驗的是模型的空間想象力。
讓圖片中人物正視前方。
提示詞:Make the person in the picture look straight ahead
原圖:
![]()
輸出結果如下:
![]()
FLUX Kontex Max Qwen-Image-Edit
從效果上看,FLUX Kontex Max和Qwen-Image-Edit不相上下,生成的正臉圖都非常自然,光影和五官結構都跟原圖完美銜接,
再加點難度,上傳一張手繪的側臉圖,讓它們生成相應的正視圖。
原圖:
![]()
輸出結果如下:
![]()
FLUX Kontex Max Qwen-Image-Edit
FLUX Kontex Max生成的效果更還原,這一局依舊勝出。
測試三:去除水印
這次看一下它們倆誰去水印的能力更強,小編特意找了一張都是水印的圖片,看看它倆誰清理的干凈。
提示詞:Remove watermarks from pictures
原圖:
![]()
輸出結果如下:
![]()
FLUX Kontex Max Qwen-Image-Edit
效果一目了然,無論是FLUX Kontex Max還是Qwen-Image-Edit都把密密麻麻的水印清理掉了,而且其他的元素一點都沒有變。
測試四:背景修改
保持主體人物的不變,更換背景,看誰背景融合的更好。
提示詞:Place the characters in the picture in the world of cyberpunk
原圖:
![]()
輸出結果如下:
![]()
FLUX Kontex Max Qwen-Image-Edit
從圖片上的質感來看,Qwen-Image-Edit在背景融合方面要比FLUX Kontex Max更強,光影融合處理得更自然。
雖然此次測試沒有基準測試那么全面,但幾輪PK下來,Qwen-Image-Edit 的優點和不足我們可以明顯看出。
雖然在某些方面沒有FLUX Kontex Max強,但實際體驗下來非常驚艷。
值得點贊的是,國產模型終于把圖像編輯的一致性難題給解決了。
據了解,Qwen-Image-Edit 是基于 Qwen-Image 模型進?步訓練的產物。
它巧妙地結合了Qwen2.5-VL(負責理解你要干啥)和VAEEncoder(負責保住原圖的樣子),從而兼具了語義與外觀的雙重編輯能力。
目前該模型已經上線了,在chat.qwen.ai并選擇“圖像編輯”功能就能免費使用,大家感興趣的可以去體驗一下。
![]()
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.