品玩12月8日訊,美團LongCat團隊今天正式發布并開源LongCat-Image圖像生成模型。該模型以6B參數規模,致力于解決當前AI圖像生成領域閉源模型無法定制、開源方案性能與輕量化難兼顧的困境,為業界提供了“高性能、低門檻、全開放”的新選擇。
LongCat-Image采用文生圖與圖像編輯同源架構設計。其在圖像編輯任務上,于ImgEdit-Bench、GEdit-Bench等權威評測中達到開源SOTA水平,實現高度可控編輯。針對中文文本渲染行業痛點,模型通過課程學習策略,精準覆蓋8105個漢字,在ChineseWord評測中獲90.7分,顯著領先同類模型,有力支持商業設計需求。
綜合主客觀評測顯示,該模型在圖文對齊、視覺真實度等關鍵維度表現優異。美團宣布全面開源其多階段訓練模型,旨在構建透明、協作的開源生態。開發者可通過Hugging Face、GitHub等平臺獲取模型,亦可通過“LongCat APP”及官方網站體驗一鍵生成功能,零門檻解鎖AI創作潛能。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.