騰訊優圖 投稿量子位 | 公眾號 QbitAI
在AIGC技術飛速發展的背景下,只需一行簡單的prompt就可生成高逼真內容,然而,這一技術進步也帶來了嚴重的安全隱患:虛假新聞、身份欺詐、版權侵犯等問題日益突出。AI生成圖像檢測也成為了AIGC時代的基礎安全能力。
然而在實際應用中, 存在一個“尷尬”現象:檢測器往往在“考場”(公開基準數據集)上分數耀眼,一旦換到“戰場”(全新模型或數據分布),性能會大幅下降。
近日,騰訊優圖實驗室聯合華東理工大學、北京大學等研究團隊在A生成圖像檢測(AI-Generated Image Detection)泛化問題上展開研究,提出Dual Data Alignment(雙重數據對齊,DDA)方法,從數據層面系統性抑制“偏差特征”,顯著提升檢測器在跨模型、跨數據域場景下的泛化能力。
目前,相關論文《Dual Data Alignment Makes AI-Generated Image Detector Easier Generalizable》已被NeurIPS 2025接收為Spotlight(錄取率 Top 3.2%)。
![]()
發現:AI圖像檢測器其實只是在“識別訓練集”
研究團隊認為問題的根源可能在于訓練數據本身的構造方式,使得檢測器并沒有真正學會區分真假的本質特征,而是“走了捷徑”,依賴于一些與真偽本身無關的“偏差特征”(Biased Features)來做出判斷。
這些偏差特征是真實圖像與AI生成圖像在訓練數據收集過程中產生的系統性差異。具體來說:
- 真實圖像:來源渠道復雜,清晰度與畫質參差不齊;分辨率分布分散;幾乎都以JPEG 格式存儲,并帶有不同程度的壓縮痕跡。
- AI生成圖像:呈現出高度統一的模式,分辨率常集中在256×256、512×512、1024×1024等固定檔位;并且大多以PNG等無損格式存儲;畫面干凈,沒有明顯壓縮痕跡。
在這樣的數據構成下,檢測模型可能會去學習“投機策略”,例如PNG≈假圖,JPEG≈真圖。這種“捷徑”可以在某些標準測試集(如GenImage)上甚至可以達到100%的檢測準確率,然而一旦對AI生成的PNG圖像進行簡單的JPEG壓縮,使其在格式和壓縮痕跡上接近真實圖像,這類檢測器的性能就會出現“斷崖式下跌”。
對比真實圖像和AI生成圖像,兩者可能存在格式偏差、語義偏差和尺寸偏差:
![]()
解法和思路
針對這一問題,研究團隊認為如果數據本身帶有系統性偏差,模型設計的再復雜也難免“學偏”。因此提出了DDA(雙重數據對齊,Dual Data Alignment) 方法,通過重構和對齊訓練數據來消除偏差。其核心操作分為三步:
![]()
- 像素域對齊(Pixel Alignment)
使用VAE(變分自編碼器)技術對每一張真實圖像進行重建,得到一張內容一致、分辨率統一的AI生成圖像。這一步操作消除了內容和分辨率上的偏差。
![]()
- 頻率域對齊(Frequency Alignment)
僅僅像素域對齊是不夠的,由于真實圖像大多經過JPEG壓縮,其高頻信息(細節紋理)是受損的;而VAE在重建圖像時,反而會“補全”這些細節,創造出比真實圖像更豐富的高頻信息,這本身又成了一種新的偏差。
△可視化對比真實圖像(JPEG75)和AI生成圖像(PNG)的高頻分量
實驗也證實了這一點:當研究者將一幅重建圖像中“完美”的高頻部分,替換為真實圖像中“受損”的高頻部分后,檢測器對VAE重建圖的檢出率會大幅下降。
△對比VAE重建圖和VAE重建圖(高頻分量對齊真實圖像)的檢出率
因此,關鍵的第二步是對重建圖執行與真實圖完全相同的JPEG壓縮,使得兩類圖像在頻率域上對齊。
![]()
- Mixup
最后采用Mixup將真實圖像與經過對齊的生成圖像在像素層面進行混合,進一步增強真圖和假圖的對齊程度。
![]()
經過上述步驟,就能得到一組在像素和頻率特征上都高度一致的“真/假”數據集,促進模型學習更泛化的“區分真假”的特征。
實驗效果
傳統的學術評測往往是為每個Benchmark單獨訓練一個檢測器評估。這種評測方式與真實應用場景不符。
為了更真實地檢驗方法的泛化能力,研究團隊提出了一種嚴格的評測準則:只訓練一個通用模型,然后用它直接在所有未知的、跨域的測試集上評估。
在這一嚴格的評測標準下,DDA(基于COCO數據重建)實驗效果如下。
- 綜合表現:在一個包含11個不同Benchmark的全面測試中,DDA在其中 10個 上取得了領先表現。
- 安全下限(min-ACC):對于安全產品而言,決定短板的“最差表現”往往比平均分更重要。在衡量模型最差表現的min-ACC指標上,DDA比第二名高出了27.5個百分點。
- In-the-wild測試:在公認高難度的真實場景“In-the-wild”數據集Chameleon上,檢測準確率達到82.4%。
- 跨架構泛化:DDA訓練的模型不僅能檢測主流的Diffusion模型生成的圖像,其學到的本質特征還能有效泛化至GAN和自回歸模型等完全不同,甚至沒有用到VAE的生成架構。
![]()
無偏的訓練數據助力泛化性提升
在AI生成圖像日益逼真的今天,如何準確識別“真”與“假”變得尤為關鍵。
但AIGC檢測模型的泛化性問題,有時并不需要設計復雜的模型結構,而是需要回歸數據本身,從源頭消除那些看似微小卻足以致命的“偏見”。
“雙重數據對齊”提供了一個新的技術思路,通過提供更“高質量”的數據,迫使這些模型最終學習正確的知識,并專注于真正重要的特征,從而獲得更強的泛化能力。
論文地址:https://arxiv.org/pdf/2505.14359
GitHub:https://github.com/roy-ch/Dual-Data-Alignment
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.