長文章“一圖讀懂”類信息圖,如何一次出圖并去幻覺
![]()
文 / 書航 2025.11.26
由于香蕉2對超長中文文本的生成把控非常好,不再生成偽漢字,因此為一次性出圖創(chuàng)造了條件。但是,對于較長的信息內容,如果指代不明,仍可能會編造事實或者出圖不符合預期。
本次工作的實際任務是給定一篇稿件,按照稿件內容生成“一圖讀懂”。在實操過程發(fā)生了兩種問題:
直接將文章作為附件或者貼入提示詞,會生成失敗。
根據(jù)文章意思概括提示詞,不附帶原文。如果有哪個地方沒有說清楚,就會發(fā)生意料之外的情況。
之前網(wǎng)上給出的案例基本是調用模型原本的世界知識,以one-shot生成信息圖,如“生成圖片說明咖啡機的工作原理”。
![]()
在接到任務后,我首先讓AI出提示詞方案,并經過記者選擇合適的方案(在5個方案中選擇了方案1和3)。
![]()
![]()
但當我將原文附件及提示詞方案合并,選擇“圖像生成”模式并要求出圖后,一直轉圈卻沒有結果。
![]()
一小時后我回來刷新頁面,發(fā)現(xiàn)根本就沒成功。
![]()
所以在Gemini官方版本中,選擇“圖像生成”模式時是不應該疊加附件的。
與此同時,直接用方案文本作為提示詞生成則可以出圖。
Prompt:
幫我做一個信息圖表,圖片格式,要求是豎版,能確保信息素不丟失,寧愿圖更長一點: (下接方案文本內容)
但隨之而來的問題是,提示詞過于簡略,導致“自由發(fā)揮”的部分會出問題。
![]()
例如,這個局部的武漢、西安、鄭州的取舍就出現(xiàn)了和正文描述不同的偏差,這是因為提示詞沒有詳細說明這一部分。
解決方法:另開一個對話,拖入原文及上述提示詞,要求:
請結合附件文章及現(xiàn)有提示詞為nano banana設計出長圖的完整提示詞,因為它無法讀取附件,也不能用太長的提示詞文本,但我擔心直接使用現(xiàn)有提示詞會丟失文中數(shù)據(jù),或者導致不準確。請注意:只出提示詞,不出圖片 (下接剛才的Prompt)
然后Gemini3輸出了新的,經過事實核查并說明更豐富細節(jié)的提示詞。
![]()
讓Nano Banana 2新做一下就完全正常了,一次成功。
![]()
(成品圖。水印及l(fā)ogo為后期添加)
![]()
接著下一個圖,我發(fā)現(xiàn)它換了一個新的風格,因此我又提示它:
請把(圖2名字)的畫面風格,與上面(圖1名字)相統(tǒng)一,其余數(shù)字等不變,輸出一個新的提示詞。
此時風格就和剛做的第一張圖相統(tǒng)一。在記者對比后,最終選擇圖1作為本文的最終版配圖。
去水印方法也說一下:
Nano Banana 作圖在右下角有一個四芒星的水印,用去水印工具直接處理原圖會識別不到水印。
建議將原圖右下角截取一小段,去水印后升幅畫質,直接在Windows自帶的畫圖里面就可以拼合。
![]()
總結:
讓Gemini 3根據(jù)你選擇的方案,再次閱讀原文,事實核查圖片以及確保數(shù)字、事實等已經被明確框定。
用這個提示詞去作圖。
如果有系列圖片,需要讓Gemini 3指定跟系列圖片的第一張圖的提示詞采用同樣的風格,它就會給你完成風格對齊。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.