AIPress.com.cn報道
12 月 31 日,阿里巴巴旗下通義千問團隊正式發布新一代圖像生成模型 Qwen-Image-2512。該版本在人物真實度、自然紋理刻畫以及復雜文字渲染等方面實現大幅升級,被官方稱為“更接近真實世界的圖像生成模型”。
據介紹,Qwen-Image-2512 在前代模型基礎上進行了系統性優化,尤其針對以往生成圖像中常見的“AI 感”問題進行重點改進。在人物肖像、自然場景、文字排版等多個維度,新模型展現出更高的真實度與穩定性。
在人物生成方面,Qwen-Image-2512 顯著提升了皮膚質感、面部細節和發絲表現力。無論是年輕人、老年人,還是不同性別與氣質的人物形象,模型均能呈現更自然的面部紋理和光影變化,減少以往常見的塑料感和模糊邊緣。在多組對比示例中,新模型對眼神、表情和肢體姿態的還原更加符合真實攝影效果。
![]()
在自然環境和物體紋理方面,Qwen-Image-2512 同樣表現出更高的細節密度。山川、河流、植物、動物毛發等元素的層次更加豐富,紋理過渡更加自然。官方展示的案例中,無論是瀑布水流、森林植被,還是動物皮毛與巖石表面,均呈現出更接近真實攝影的質感。
![]()
值得注意的是,Qwen-Image-2512 還顯著增強了復雜文字與圖文混排的生成能力。模型在生成包含標題、段落、信息圖、PPT 頁面等內容時,能夠更準確地控制文字布局、層級結構與排版邏輯,減少錯字、錯位和排版混亂問題。這使其在信息圖、演示文稿、科普海報等場景中具備更強的實用性。
![]()
在技術層面,官方表示,新版本在模型訓練和推理策略上進行了系統優化,使模型在保持高分辨率輸出的同時,進一步提升了穩定性與一致性。根據團隊披露的數據,在多個公開評測中,Qwen-Image-2512 的綜合表現已達到或超過當前主流開源圖像模型,并在部分指標上接近閉源商業模型水平。
目前,Qwen-Image-2512 已同步上線 ModelScope、Hugging Face 以及阿里云百煉平臺,支持開發者和創作者直接調用。官方表示,未來還將繼續圍繞真實感、可控性與專業創作場景進行迭代,推動圖像生成從“可用”邁向“可商用”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.