我是刀哥,
大廠工作過幾年,現在是出海創業者,深入研究AI工具和AI編程。
大灣雞奇遇記
現在很多AI修圖的痛點是,只能打字修圖,沒法拆開一個個元素看,一個個字兒改。但你不拆開大家就會很困惑,就像小鵬機器人,里邊到底藏了個什么?
![]()
這其實是很反直覺的,就像碼農寫了幾千行的代碼,現在跟你說,想改幾行只能完全重寫;就像樂高積木拼了幾千個積木,有一塊兒拼錯了想改,只能全拆了重拼。。。
有沒有一個AI P圖工具,可以揉碎了掰開了,讓大家看清楚每個元素,能修改每個元素?這次有了!
打開lovart : https://www.lovart.ai/
拆點什么好呢?就來拆大灣雞!
11月9日晚,第十五屆全國運動會開幕式在廣州舉行,以中華白海豚為原型設計的十五運會和殘特奧會吉祥物“喜洋洋”和“樂融融”,這兩個吉祥物“顯眼包”火出圈!因為很像廣東美食,被稱為大灣雞!
![]()
就是它們了!找到一張宣傳海報,開整!
![]()
新建項目,把圖片放上去,然后編輯元素,等個一分鐘,分開了!
抓住兩個打工仔: “喜洋洋”和“樂融融”,看視頻:
把兩個打工仔拉到太平洋上去搞貨運,很輕松,只需要單獨做個背景圖, 放到圖層最底下就可以了:
![]()
還可以把 “喜洋洋” 做成貼紙放到 “樂融融” 身上:
![]()
讓打工仔坐在辦公室給我們干活:
![]()
讓打工仔去送外賣:
![]()
新的自制IP誕生了!!!咱們不懂設計不會PS也可以給大灣雞做周邊了!只需要一句話,例如設計金屬鑰匙扣,Lovart會一步步加提示語做設計
![]()
等個不到一分鐘,來了!
![]()
![]()
很萌很萌!有沒有想訂購的?評論區留言,送。。。。。。。 圖。。。
有網友做了好玩的表情包,咱們可以拆出來換成別的想要的字兒
![]()
也可以輕松自制表情包:
![]()
元素復雜的頂級廣告圖,也能一鍵拆開:
![]()
蒙娜麗莎她是誰?咱們把她請出來跟大灣雞一起玩!
一鍵移除背景
![]()
牽手牽手,牽起大灣雞小手,走你!
![]()
假如我們用別的AI,則是這種效果 ,明明只想改文字,會改我們不想改的背景。
![]()
![]()
更復雜的改動那變化就更大了, 足以讓你氣坑(很生氣,覺得被坑了)。
做大灣雞這種視頻呢?沒問題

拿新上架的 Sora2+Veo3.1+Hailuo 2.3 + LTXV 2 一個個試,咱也做出來大灣雞視頻了:
(Lovart里的圖生視頻模型LTXV制作)
Lovart是怎么做到分層的?
這塊兒我非常好奇,為什么國內外的SOTA大模型和工具都沒有這個功能?為什么 Midjourney (MJ)、KLing這些巨頭沒有主打這個功能?
我猜測啊,是因為技術門檻。
核心難點:萬物分割 (Universal Segmentation)
AI 需要理解圖片中的“前景”、“背景”、“文字”分別是什么,并且精確地勾勒出它們的邊緣。
這依賴于強大的圖像分割模型,做 前景、全景、文本分割。Meta 的 SAM (Segment Anything Model),它就是這類技術的代表, 論文鏈接:https://arxiv.org/abs/2304.02643 。Lovart 很可能使用(或自研了)類似的先進模型。
SAM 的核心輸出是針對原圖中每個識別對象的分割蒙版(Segmentation Mask)。
利用這些蒙版,可以輕松地執行提取操作:將原圖中的像素數據與對應的蒙版結合,去除(或設置為透明)蒙版以外的區域。
最終,為每個蒙版對象保存為一個獨立的圖像文件(例如 PNG 格式,帶有透明背景),即可實現將原圖中的多個物體分離成多張獨立子圖。
那每張子圖是如何展示在正確的原圖位置上呢?
SAM 的輸出可以直接提供精確的坐標信息,也就是邊界框(Bounding Box),它是最常用且最直接的位置信息。對于每個分割對象,程序可以計算出一個矩形邊界框,并提供其四個角的坐標:x_min, y_min, x_max, y_max。這就精確定義了每個對象在原圖上的相對位置和大小
Lovart 的“魔法”在于,它把分割模型SAM和其他所有模型(修復、OCR、文本生成)集成在一個統一的界面(“畫布”)中。看上去真的是一鍵炸開!
實際上AI在后臺已經完成了分割所有圖層 ,并預先填補了所有背景,最后呈現給你一個類似 Photoshop/Figma 的、包含多個圖層的可編輯文件。
Adobe 在 2023 年 Max 大會上展示的 "Project Stardust"(星塵計劃)的核心功能,幾乎和Lovart 一模一樣。它能自動識別圖像中的物體為 可編輯對象 ,讓你隨意拖動、刪除、修改,并自動填充背景。
可惜,Adobe并沒有做出來。
結語
拆圖層這項技術非常新,必然是 AIGC 領域的下一個戰場——從 生成 轉向 生成式編輯 。
Lovart 作為一家更專注、更敏捷的初創公司,選擇將這個下一代功能作為核心賣點,率先推向了市場,而 Adobe卻遲遲不能把PPT期貨給兌現了,天壤之別。
Lovart懂我們,我們需要的不僅僅是生成圖片,更是掌控和編輯圖片的自由。
通過集結(Segmentation + Inpainting + OCR + Text Generation)的AI技術全家桶,Lovart 解決了一個過去只有專業設計師才能(通過摳圖、蒙版、仿制圖章)解決的繁瑣問題,極大地降低了設計的門檻。好樣的!
不刷短視頻,讀我的公眾號長文還讀完了?您真是一股清流!如果覺得寫得不錯,歡迎點贊、在看、關注。如果有不同看法,歡迎在評論區或者后臺留言討論。
我是刀哥,大廠工作過幾年,現在是出海創業者,深入研究AI工具和AI編程。關注我,了解更多AI知識!我們下期再見!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.