這是蒼何的第 474 篇原創(chuàng)!
大家好,我是消失了一段時間的蒼何。
1 月 5 號,我寫了篇文章,并開源了 AI 漫劇 APP,獲得了很多朋友的喜歡。
![]()
然后在 GitHub 上一共獲得了 764 星和 181 fork,讓我有些吃驚。
![]()
說實話,這個項目遠超我們的預期,甚至連歪果哥都來給我們提 issue,希望支持雙語。
![]()
甚至還有老板來咨詢問我賣不賣這個 APP,我說,大哥,咱都開源了,自己去整吧,不用付費,哈哈哈。
這或許就是開源的魅力吧。
但我發(fā)現(xiàn),APP 還是不大方便,評論區(qū)也不少求 web 版本的。
![]()
于是,我們又花了 20 天,開源了個 Web 版本的 AI 漫劇平臺,他是長這個樣子的。
![]()
主打的人群還是對 AI 漫劇感興趣的小白群體,能夠一句話生成漫劇故事。
如果你不知道生成什么故事,也可以使用系統(tǒng)內(nèi)置的模板,比如「馬到成功送祝福」、「馬上有美食」等新年主題的故事。
![]()
為了照顧一些朋友想要自由發(fā)揮的需求,我們還添加了自定義工作流選項,也就是從創(chuàng)建角色到分鏡編排,再到生成鏡頭,最后導出,都可以自定義。
![]()
在編排的時候,你可以自定義不同的鏡頭,比如全景、中景、特寫,可以添加鏡頭和場景。
![]()
可以生成不同的鏡頭視頻。
![]()
在底層,做了很多的處理,能保證角色的一致性。
![]()
做了幾個系列,分別對應 2D、3D、寫實等場景。
![]()
我們做了非常多深度的調(diào)優(yōu),在保持人物一致性的同時也添加了不少細節(jié)去優(yōu)化生成的效果。
![]()
下面,我來分享下在開發(fā)這個項目過程中,我們踩過的坑,和一些可能算不上什么經(jīng)驗的經(jīng)驗,另外也教下大家怎么使用。
創(chuàng)作和開源不易,如果文章對你有幫助,歡迎點贊轉(zhuǎn)發(fā)。經(jīng)驗分享
我感覺最頭疼的問題之一是角色一致性問題,也就是角色在不同畫面中長得不一樣,該如何很好的解決。
我們嘗試使用了不少辦法,甚至引入了本地 ComfyUI,開啟鎖定種子,第一張圖的種子會被記錄,后續(xù)所有圖使用相同的種子,以保持整體風格的一致性。
![]()
總結出角色一致性最佳實踐如下:
- 參考圖選擇:清晰、無遮擋、多角度
- 描述格式:「性別+年齡+發(fā)型+發(fā)色+眼睛+服裝+特征」
- 示例:「25歲女性,黑色長直發(fā),棕色大眼睛,穿白色襯衫和黑色西裝裙,戴細框眼鏡」對于鏡頭,考慮很多像我一樣對運鏡不大熟悉的小白,我們內(nèi)置了 9 種標準鏡頭模板,AI 根據(jù)故事自動選擇不同分鏡的鏡頭。
![]()
對于生成質(zhì)量上,有以下幾點可以給大家分享:
- 畫面描述要具體,避免模糊詞匯
- 使用「鎖定種子」保持風格統(tǒng)一
- 負面提示詞排除不想要的元素
- 多生成幾次,選擇最滿意的在鏡頭節(jié)奏上,建議采用如下方式:
基本原則:
- 全景→中景→特寫(漸進式)
- 對話場景用過肩鏡頭正反打
- 情緒高潮用特寫
- 場景轉(zhuǎn)換用全景或框中框示例分鏡節(jié)奏:
1. T1 全景俯瞰 - 城市遠景(建立環(huán)境)
2. T2 環(huán)境中景 - 主角走在街上(角色入場)
3. T4 標準中景 - 主角看手機(日常動作)
4. T6 特寫 - 手機屏幕顯示消息(信息傳遞)
5. T6 特寫 - 主角驚訝表情(情緒反應)
6. T8 跟隨視角 - 主角奔跑(動態(tài)轉(zhuǎn)場)
如何使用
我們整理了一份詳細的使用指南,還沒放到 GitHub,大家如果需要可以評論區(qū)留言,或者等我們推到 GitHub 哈。
先來看下整體流程:
[導入劇本] → [創(chuàng)建角色] → [創(chuàng)建場景] → [編排分鏡] → [生成圖片] → [生成視頻] → [導出]
↓ ↓ ↓ ↓ ↓ ↓
(可選) 上傳參考圖 上傳參考圖 選擇模板 AI生成 (可選)
填寫描述 填寫描述 寫畫面描述 保持一致性 ![]()
生圖這里你可以選擇本地 ComfyUI 的方式,也可以選擇 API 的方式。
這里以 API 為例,如果你希望穩(wěn)定,性價比高的 API 平臺,可以試試 Atlas Cloud。
地址:https://www.atlascloud.ai?ref=AXZ9S7
在漫劇場景中穩(wěn)定出圖出視頻很重要,而且對于內(nèi)容角色的生成,最好避開接口的審查和限制規(guī)則。
Atlas Cloud 這個 API 聚合平臺能很好的滿足漫劇這個場景的需求,畢竟它主打的是企業(yè)級 API 聚合,擁有 300+ 知名大模型,總結下來是:穩(wěn)定、易用、低價。
![]()
那該如何使用呢?注冊登錄后,打開控制臺,新建 API 密鑰。
![]()
多說一嘴,Atlas Cloud 目前注冊綁卡即可白嫖 1 美元使用額度,可以免費生成不少圖了。
填寫名稱后,點擊創(chuàng)建:
![]()
然后復制這個 API,填入到環(huán)境變量中:
![]()
需要復制一份 env,然后把改調(diào)用方式為使用云端 API 的方式:
![]()
然后就可以啟動項目,項目啟動后,你可以一句話生成故事,也可以按照流程自定義,你可以先創(chuàng)建一個角色并添加場景:
![]()
角色描述和場景描述都可以用 AI 生成,也可以自定義更改。
然后就是對鏡頭進行編排,可以添加自定義鏡頭,描述同樣也可以 AI 一鍵生成,不滿意可以改。在這里你可以選擇需要出鏡的角色:
![]()
可以看到已經(jīng)添加的鏡頭列表,有專業(yè)分鏡格式的標準提示語,對于分鏡的生成效果會更好。
![]()
然后就可以生成鏡頭和對應的分鏡視頻:
![]()
可以選擇一鍵生成全部視頻,這里選擇 API 的方式來生成。
![]()
最后,你可以導出所有的圖片包、視頻包、分鏡腳本,做素材備份,最后就是做視頻的合成。
![]()
我們做了比較詳細的產(chǎn)品特點說明說和使用說明書,目前還在優(yōu)化中,如果你想提前看看,可以評論區(qū)告訴我。
說真的,這套系統(tǒng),我認為,還是又再次滿足了我做漫劇的激情,雖然我們不是專業(yè)的漫導,也非該行業(yè)的從業(yè)者。
但通過 AI 編程,我們也能做出一個,算是能滿足我們需求的工具,然后去滿足我們做漫劇的心。
因為是開源平臺,你可以自定義各種花式玩法,覺得哪兒不滿意,甚至可以讓 Claude Code 幫你改。
有時候,我覺得 AI 編程最大的價值,或許在于:
滿足自己的靈魂,而非取悅別人。
如果你喜歡我們的作品,也歡迎給我們 star,如果你想加入我們平臺共建,也歡迎聯(lián)系我。
目前平臺有三個核心貢獻者,分別是貓哥,蝸牛和蒼何。
我們會在深夜暢聊產(chǎn)品的,溝通如何優(yōu)化。
![]()
每當在 GitHub 上有新的進步,我們會為此而歡呼,當然,我們今年的目標是破千 star,也不知道能不能完成,哈哈哈。
![]()
當然我知道,我們做的遠遠不足,很多想要優(yōu)化的點都還沒優(yōu)化,一方面是因為我們時間精力問題,另一方面,我們對漫劇這個行業(yè)的 know how 還有限。
當然了,我也在不斷的學習,學習優(yōu)秀的產(chǎn)品,學習他們?nèi)绾巫龀鼍返穆 ?/p>
最近也在用 oiioii 來學做精品漫劇,到時候再來和大家分享了。
好啦,最后,如果你有一定的 vibe coding 能力,同時也是 AI 漫劇的熱愛者,歡迎加入我們 GitHub 開源項目的共建。
感謝你喜歡我的文章,我們下一期見啦。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.