![]()
前段時(shí)間我接了一個(gè)做古裝短劇配圖的工作室訂單,對方上來就扔了一段話——"我們用AI給小說生圖,前5張女主是黑發(fā)高髻,第8張變成了卷發(fā),第12張裙子顏色直接換了,客戶要求退款,我們不知道怎么辦。"
我打開他們的提示詞記錄看了一眼,問題一目了然,指令根本沒有給AI建立"記憶錨點(diǎn)",每一幀都是AI自由發(fā)揮的結(jié)果。
1、先建檔,再生圖——人物視覺檔案機(jī)制
很多人做文生圖的邏輯是:把小說段落扔給AI,讓它直接出圖描述。這個(gè)邏輯本身就錯(cuò)了。
AI沒有跨輪次記憶,每一次生圖對它來說都是全新任務(wù),上一幀女主穿什么、梳什么發(fā)型,它根本不記得。所以我在指令里設(shè)計(jì)了一個(gè)強(qiáng)制前置步驟:在開始生成任何提示詞之前,必須先通讀全文,逐一提取主要人物的固定視覺標(biāo)簽,格式鎖定為年齡、發(fā)型頭飾、服裝顏色材質(zhì)款式、外貌特征四個(gè)維度,列成檔案,后續(xù)所有生圖動(dòng)作都基于這份檔案執(zhí)行,絕對不允許偏移。
這一步解決的是人物"前后不一致"的根本問題。
2、死命令級(jí)的人物描述強(qiáng)制嵌入
建檔只是第一步,更關(guān)鍵的是讓AI在每一幀都"記得用"。
我在指令里加了一條死命令:只要畫面中出現(xiàn)主要人物,無論這個(gè)人物在上一句剛出現(xiàn)過,都必須在人物名字后的緊鄰位置,用全角括號(hào)完整重復(fù)一遍視覺描述,包括性別、年齡、服飾和妝容,一個(gè)都不能省。
很多人覺得這很啰嗦,但這恰恰是文生圖指令和普通寫作指令最大的區(qū)別。文生圖的每一行提示詞,本質(zhì)上是一個(gè)獨(dú)立的繪圖指令,AI不會(huì)自動(dòng)繼承上下文,必須在每一行都把關(guān)鍵信息喂給它。這條死命令,就是解決"AI自作主張換造型"的核心機(jī)制。
3、一體化段落結(jié)構(gòu),拒絕碎片化描述
這個(gè)工作室原來的做法是把"提示詞"和"場景描述"分兩欄寫,一欄寫角色動(dòng)作,一欄寫畫面參數(shù)。乍一看很整齊,實(shí)際上是把本該連貫的畫面信息切碎了。
我把指令結(jié)構(gòu)改成一體化段落式:人物(帶完整括號(hào)描述)+具體動(dòng)作神態(tài)+時(shí)間光影+背景環(huán)境+鏡頭語言,全部寫在一行,不斷行不回車,每一個(gè)小說段落對應(yīng)一條完整提示詞。
這樣做有兩個(gè)好處:一是AI獲取的信息是完整的,不會(huì)因?yàn)?分欄"導(dǎo)致信息錯(cuò)位;二是生成的提示詞可以直接輸入Midjourney或其他工具,不需要二次整理。
同時(shí),我還單獨(dú)設(shè)計(jì)了空鏡頭處理規(guī)則:凡是純景物或特寫道具的畫面,開頭必須標(biāo)記"無人:2,空鏡頭,"再接描述,防止AI在本該空鏡的畫面里憑空加出人物。
4、風(fēng)格邊界鎖死,古裝就是古裝
工作室的另一個(gè)問題是偶爾出現(xiàn)"現(xiàn)代感"元素,比如背景里隱約有玻璃窗,或者人物配飾有金屬光澤過強(qiáng)的問題。
我在指令末尾加了一條硬性風(fēng)格約束:場景必須保持中國古代宋朝風(fēng)格,明確列出禁止出現(xiàn)的元素,包括現(xiàn)代城市、玻璃、霓虹燈、手機(jī)、槍械、機(jī)械、科幻光效。邊界越清晰,AI的發(fā)揮空間越受控,出圖的穩(wěn)定性越高。
交付后,工作室反饋,同一個(gè)人物連續(xù)出圖30幀,造型保持穩(wěn)定,客戶驗(yàn)收通過。
文生圖不只是"寫描述",底層是一套人物管理×信息傳遞×風(fēng)格約束的系統(tǒng)工程,指令不到位,模型再好也白搭。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.