騰訊開源生圖模型 3.0,試了一下世界知識可以媲美 Banana,甚至可以圖解中學幾何題!美學和文字排版也達到了一流水平,太頂了。
模型參數高達 80B,這次的升級主要特點是:
1. 可以生成較長的文字,包括中文;
2. 了解世界知識并且可以進行一定程度的推理;
3. 美學表現相較于之前提升較大。
我也做了一下詳細的測試,文字生成和世界知識這塊非常的頂,提示詞放在圖片下方了。
世界知識這塊,我先是讓他解一些涉及到圖像的數學幾何體、物理或者化學題。
它可以在生成的圖片上完美的展示解題步驟,左邊展示對應的示例圖案,解題步驟和答案的正確率接近 100%,左邊的圖例偶爾有問題,但已經非常牛皮了。
搞定之后又讓他生成其他人文社科之類的圖片,比如推理和展示蒸汽機的發展路線,除了偶爾小字有問題外,整個圖案示例畫的相當簡單易懂。
生成對應的詩詞解釋卡片也都沒問題,可以畫出詩詞對應的景色,還能生成詩詞的背景和主旨。
還有常見的知識卡片,比如食譜和游戲卡片也沒啥問題,這部分如果他輸出文字較少的話你可以在提示詞規定對應的文字數量。
在文字生成這部分測試了一下之前常用的復雜排版玄學壁紙和單純的字體設計。
基本上都可以按照要求的排版方式和字體畫出對應的圖片,而且上面也都有對應的文字內容。
純粹的藝術字體生成先是讓他生成類似篆體的 Logo,確實非常有那個神韻。然后是書法字體也生成的相當不錯,有那味了。
然后肉讓他整了兩張復雜的中秋海報,涉及到文字生成、排版位置和畫面風格,都處理的不錯,基本達到了現在頭部圖像模型的水平。
目前跟 Banana 的差距就是圖像編輯了,暫時還沒有這個能力,但是有內幕消息說國慶之后估計就有了。
開源的這種級別的圖像編輯和世界知識圖像模型,想象力還是非常大的, 加上微調之后可以搞很多好玩的。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.