網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

古裝小說文生圖DeepSeek指令定制3個(gè)鎖定，人物從頭到尾不跑偏

2026-04-08 00:10:03　來源: 太公筆調(diào)

廣東舉報(bào)

分享至

前段時(shí)間我接了一個(gè)做古裝短劇配圖的工作室訂單，對方上來就扔了一段話——"我們用AI給小說生圖，前5張女主是黑發(fā)高髻，第8張變成了卷發(fā)，第12張裙子顏色直接換了，客戶要求退款，我們不知道怎么辦。"

我打開他們的提示詞記錄看了一眼，問題一目了然，指令根本沒有給AI建立"記憶錨點(diǎn)"，每一幀都是AI自由發(fā)揮的結(jié)果。

1、先建檔，再生圖——人物視覺檔案機(jī)制

很多人做文生圖的邏輯是：把小說段落扔給AI，讓它直接出圖描述。這個(gè)邏輯本身就錯(cuò)了。

AI沒有跨輪次記憶，每一次生圖對它來說都是全新任務(wù)，上一幀女主穿什么、梳什么發(fā)型，它根本不記得。所以我在指令里設(shè)計(jì)了一個(gè)強(qiáng)制前置步驟：在開始生成任何提示詞之前，必須先通讀全文，逐一提取主要人物的固定視覺標(biāo)簽，格式鎖定為年齡、發(fā)型頭飾、服裝顏色材質(zhì)款式、外貌特征四個(gè)維度，列成檔案，后續(xù)所有生圖動(dòng)作都基于這份檔案執(zhí)行，絕對不允許偏移。

這一步解決的是人物"前后不一致"的根本問題。

2、死命令級(jí)的人物描述強(qiáng)制嵌入

建檔只是第一步，更關(guān)鍵的是讓AI在每一幀都"記得用"。

我在指令里加了一條死命令：只要畫面中出現(xiàn)主要人物，無論這個(gè)人物在上一句剛出現(xiàn)過，都必須在人物名字后的緊鄰位置，用全角括號(hào)完整重復(fù)一遍視覺描述，包括性別、年齡、服飾和妝容，一個(gè)都不能省。

很多人覺得這很啰嗦，但這恰恰是文生圖指令和普通寫作指令最大的區(qū)別。文生圖的每一行提示詞，本質(zhì)上是一個(gè)獨(dú)立的繪圖指令，AI不會(huì)自動(dòng)繼承上下文，必須在每一行都把關(guān)鍵信息喂給它。這條死命令，就是解決"AI自作主張換造型"的核心機(jī)制。

3、一體化段落結(jié)構(gòu)，拒絕碎片化描述

這個(gè)工作室原來的做法是把"提示詞"和"場景描述"分兩欄寫，一欄寫角色動(dòng)作，一欄寫畫面參數(shù)。乍一看很整齊，實(shí)際上是把本該連貫的畫面信息切碎了。

我把指令結(jié)構(gòu)改成一體化段落式：人物（帶完整括號(hào)描述）＋具體動(dòng)作神態(tài)＋時(shí)間光影＋背景環(huán)境＋鏡頭語言，全部寫在一行，不斷行不回車，每一個(gè)小說段落對應(yīng)一條完整提示詞。

這樣做有兩個(gè)好處：一是AI獲取的信息是完整的，不會(huì)因?yàn)?分欄"導(dǎo)致信息錯(cuò)位；二是生成的提示詞可以直接輸入Midjourney或其他工具，不需要二次整理。

同時(shí)，我還單獨(dú)設(shè)計(jì)了空鏡頭處理規(guī)則：凡是純景物或特寫道具的畫面，開頭必須標(biāo)記"無人：2，空鏡頭，"再接描述，防止AI在本該空鏡的畫面里憑空加出人物。

4、風(fēng)格邊界鎖死，古裝就是古裝

工作室的另一個(gè)問題是偶爾出現(xiàn)"現(xiàn)代感"元素，比如背景里隱約有玻璃窗，或者人物配飾有金屬光澤過強(qiáng)的問題。

我在指令末尾加了一條硬性風(fēng)格約束：場景必須保持中國古代宋朝風(fēng)格，明確列出禁止出現(xiàn)的元素，包括現(xiàn)代城市、玻璃、霓虹燈、手機(jī)、槍械、機(jī)械、科幻光效。邊界越清晰，AI的發(fā)揮空間越受控，出圖的穩(wěn)定性越高。

交付后，工作室反饋，同一個(gè)人物連續(xù)出圖30幀，造型保持穩(wěn)定，客戶驗(yàn)收通過。

文生圖不只是"寫描述"，底層是一套人物管理×信息傳遞×風(fēng)格約束的系統(tǒng)工程，指令不到位，模型再好也白搭。

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.