
![]()
本案的法律攻防過程(尤其原告“廣撒網”式的訴訟策略)對后續類案提供了重要啟示。本文將通過拆解原被告的訴辯和法院觀點,深入復盤這場精彩的法律交鋒。
作者 | 岳浩然 阮丹羚
近期,圍繞“未經許可使用版權作品訓練AI模型”的法律訴訟與相關討論愈演愈烈。其中,標志性的Getty Images訴Stability AI 的英國訴訟案件于2025年11月4日迎來關鍵判決。此案始于2023年1月,視覺圖片庫巨頭Getty指控人工智能新貴Stability AI“盜用”其數千萬張受版權保護的圖片,來“喂養”和訓練AI圖像生成工具Stable Diffusion。盡管英國高等法院基本駁回了原告的訴請,但對于“AI訓練是否應獲許可”這一核心問題仍懸而未決。本案的法律攻防過程(尤其原告“廣撒網”式的訴訟策略)對后續類案提供了重要啟示。本文將通過拆解原被告的訴辯和法院觀點,深入復盤這場精彩的法律交鋒。
1
原告各項訴求表格總結
![]()
原告(“Getty Images”)針對Stability AI(被告)訓練、開發和分發其生成式AI模型 "Stable Diffusion" 的訴請,是通過對該AI模型從開發到部署的過程進行了拆解,對被告就該AI模型在數據獲取端、訓練和開發端以及輸出端分別提起了不同的指控和訴請。而這種分階段指控(segmented attack)的訴訟策略,也在后續其他涉及起訴AI模型的訴訟中被廣泛應用,具體為:
(1)數據獲取端的大規模數據抓取:原告指控被告未經許可,從原告運營的網站(包括 gettyimages.com, gettyimages.co.uk 和 istockphoto.com)抓取了數百萬計的視覺資產,包括照片、視頻和插圖等。原告特別指出,Stable Diffusion是使用 LAION-5B 數據集進行訓練的,是一個通過網絡爬取而創建的“盜版”(原告稱)數據集。原告聲稱已在用于訓練 Stable Diffusion 1.0 的 LAION 子集中識別出約1200萬個指向原告網站內容的鏈接。
(2)模型訓練開發端的大量復制行為:指控被告使用這些被抓取的內容作為訓練數據,在訓練和開發其 Stable Diffusion 模型(包括 1.0 和 2.0 版本)的過程中,復制和存儲了數百萬計的原告版權作品。
(3)輸出端的侵權行為:指控被告Stable Diffusion 模型的輸出結果本身具有侵權性。這體現在兩個關鍵方面:
實質性復制:生成的合成圖像在某些情況下“實質性地復制了”(reproduce in substantial part) 原告的版權作品。
水印再現:生成的合成圖像經常“帶有 GETTY IMAGES 和/或 ISTOCK 的標志作為水印”,盡管這些水印通常是扭曲的或“部分復制”的。
2
原告初始訴請總結
基于以上指控,原告在一開始的起訴狀中,其訴訟邏輯和具體訴請為:
(1)版權直接侵權(Primary Copyright Infringement):
(a) 訓練階段(s.17 CDPA):指控被告在訓練和開發過程中,在英國境內的服務器和/或計算機上下載、存儲和復制了版權作品,侵犯了英國《版權、設計和專利法》(CDPA)s.17 條規定的復制權。
(b) 輸出階段 (s.20 / s.16(2) CDPA):指控被告通過 Dream Studio 等平臺向英國公眾傳播了帶有原告版權作品實質部分的生成圖像(違反s.20);并且,通過提供該工具,授權了英國終端用戶對上述圖像的侵權復制行為(違反s.16(2))。
(2)版權間接侵權(Secondary Copyright Infringement):
(s.22 / s.23 CDPA):指控 Stable Diffusion 軟件/模型本身構成一個侵權復制品。而被告在知曉或有理由相信其為侵權復制品的情況下,將該物品進口到英國(例如,通過 GitHub 供英國用戶下載),或在商業過程中占有、分發該侵權復制品。
(3)代表實際作者進行代表性訴訟(Representative Action):
代表性訴訟是英國《民事訴訟規則》第19.8條(CPR r. 19.8)確立的一項關鍵的程序性策略,旨在極大擴展訴訟的規模,即“凡一人以上在某項訴請中擁有相同利益(the same interest)—— (a) 該訴請可由具有該相同利益的一人或多人提起或(b)經法院可命令,使該訴請繼續由作為具有該利益的任何其他人的代表提起的訴請。”
本案中,原告Getty選擇了一位向其獨占授權的內容創作公司Thomas M. Barwick, Inc.作為本案共同原告,進而以該創作者為所有獨占許可創作者的代表,來向被告提起版權侵權的指控。
(4)數據庫權利侵權(Database Right Infringement):
原告主張其版權作品的集合構成受 1997年《數據庫條例》保護的數據庫(基于在獲取、核實和呈現內容方面的“大量投資”)。該《數據庫條例》是英國對歐盟《數據庫指令》(Directive 96/9/EC)的本地化實施,其中確立了一種數據庫權(Database Right)。這是一種自動產生的、無需注冊的財產權 。但又與版權不同的是,數據庫權不要求匯編的內容或其編排具有獨創性。相反,它唯一的目標是保護數據庫制作者在“獲取”(obtaining)、“核實”(verifying)或“呈現”(presenting)數據庫內容方面所付出的“實質性投資”(substantial investment)。如果一個數據庫的創建需要大量的人力、財力或技術投入來搜集、驗證或組織其數據,那么該數據庫就可能受到此項權利的保護。
原告指控被告的抓取行為構成了對數據庫內容的非法提取(Extraction),而使用這些數據進行訓練則構成了非法再利用(Re-utilisation)。
(5)商標侵權(Trade Mark Infringement):
依據 1994 年《商標法》,指控被告在商業過程中,在其AI 圖像生成服務的輸出圖像上附加(affixing) 了與原告注冊商標(GETTY IMAGES, ISTOCK)相同或相似的標志(即扭曲的水印),且這些附加原告商標的圖像中經常包含一些質量低甚至構成色情暴力的圖像,這導致了混淆可能性、對其顯著性的淡化以及對其聲譽的損害。
(6)仿冒(Passing Off):
指控被告的行為(特別是在輸出圖像上生成水印)構成了一種虛假陳述(misrepresentation),暗示其服務與原告存在商業聯系、贊助或許可,而這種聯系并不存在。這種行為損害了原告在其商標下形成的“實質性且有價值的商譽”。
3
原告放棄和被駁回的訴請
然而,在訴訟推進過程中,原告最初針對被告AI模型“全生命周期”的分階段打擊,卻面臨著管轄權障礙、證據挑戰和程序障礙等。阻礙的核心,在于被告抗辯原告指控的AI模型開發下的數據獲取和訓練行為均發生在美國的亞馬遜網絡服務(AWS)云集群上,由于不在英國境內,故本案法院對上述指控沒有管轄權。
基于上述障礙,原告在后續的訴訟過程中放棄了部分訴訟主張以及被駁回了代表性訴訟的請求。具體為,在 2025 年 6 月的最終審判前夕及審判期間,原告承認并放棄了其最初訴狀中的三項核心知識產權主張:
(1)“訓練端”復制侵權指控的放棄
起初,原告推斷被告是一家在英國注冊的公司且其開發團隊(包括其 CEO)在英國工作,因此在開發和訓練 Stable Diffusion 期間,版權作品被推斷會被下載到了英國的服務器和/或計算機上。但在審判中,原告承認沒有證據表明 Stable Diffusion 的訓練和開發發生在英國境內。
這是面對屬地管轄權障礙不得不做出的讓步。英國版權法(CDPA)作為一項領土性權利,其第16條把“受限制的行為”(復制、發行、向公眾傳播等)明確為權利人在英國境內享有的專有權,因此主要侵權條款(如s.17關于復制權的相關條款)不具有普遍的域外效力。如果沒有證據證明在英國境內發生了復制行為,針對訓練階段的主要版權侵權主張便無法成立 。
(2)“輸出端”傳播和授權侵權的放棄
原告指控被告AI模型的輸出的圖像復制了其版權作品的實質部分。但在提起訴訟后,被告在其云端產品側屏蔽了涉訴的提示詞,基本實現了原告要求的禁令所要達到的效果,對此原告也表示承認,該禁令和訴請已實質性實現了救濟。
同時,由于對輸出端圖像包含原告享有版權的實質性部分的問題上,涉及原告需對如何選擇用以比對的輸出圖像、如何比對、以及這些實質性部分是否是不被版權法保護的“風格、特征”等問題進行策略安排和舉證,而這是一個非常棘手和前沿的問題。加之原告訴請的戰線已經拉得很長很廣,或類似的訴請原告寄希望于在美國起訴的案件中進行主張,總之,原告放棄了針對輸出端侵權的主張。
(3)數據庫權利侵權訴請的放棄
原告對于被告抓取和訓練行為侵犯其數據庫權的主張也受到了屬地管轄問題的障礙。即數據庫權是一項由英國議會(源于歐盟指令)創設的法定權利。要構成侵權,非法的“提取”或“再利用”行為必須發生在英國境內。且對于“再利用”的主張,依附于上述對訓練端和輸出端的主張,而上述主張已經被迫放棄。因此,由于原告無法證明被告的提取和再利用發生在英國境內,原告在最終審判前也放棄了這項訴請指控。
(4)代表性訴訟的程序性失敗
在上述實質性訴請放棄之前,原告在訴訟策略上還面臨了一個重大的程序性挫折。即原告試圖發起代表性訴訟的請求被法院駁回。法院駁回的理由在于,英國的代表性訴訟的門檻是:被代表的一群人對同一項或若干“共同問題”具有“同一利益”(same interest)。
(a)對所代表的成員類別的定義不滿足要求(Defective Class Definition)
對于代表性訴訟所要代表的成員類別,原告將其定義為向Getty Images獨占許可了版權,且被告侵犯了該版權,那么這些版權人就是代表性訴訟所被代表的成員(those who are owners of the copyright... the copyright in which has been infringed by the Defendant) 。
但法院認為這一定義存在循環論證的缺陷,即根據先案Lloyd v Google案確立的法律原則,一個群體的成員資格“不應取決于訴訟本身的結果”。原告的定義中,“版權已被侵犯”恰恰是本案未決的核心爭議點,即具體哪一位作者的哪一張作品被被告訓練或傳播,這要逐個證明和審查,因此不能作為確定某人是否有資格成為類別成員的前提。
(b)缺乏“相同利益”(“Same Interest”)
原告主張,所有成員都共享一個相同的利益,即“確保他們的版權不被被告侵犯”。對此主張,法院接受了被告的論點,即確定侵權以及相應的損害賠償,需要“個案評估”(individualised assessment),比如:每個許可人的具體哪些作品被用于訓練?相關的輸出是否包含了對該特定作品的“實質性部分”復制?如果包含,比例又是多少?相應的損害賠償是多少?
由于這些問題在不同的版權人之間存在巨大差異,不符合 CPR 19.8 所要求的“相同利益”標準,無法通過一個代表訴訟來統一解決。且原告未能提出一套基于該些差異,能合理管理成員間差異并達成成員共識的方案。從而駁回了代表性訴訟的請求,迫使原告只能就其直接擁有版權或可明確證明其獨占許可的作品樣本而單獨提起訴訟。
4
原告保留下來的訴請
4.1 版權間接侵權的主張
在版權直接侵權主張和數據庫權主張全部被放棄后,原告的版權主張最終完全依賴于其“間接版權侵權”上。
英國版權法下的間接(次要)侵權是指:未直接實施復制/傳播等“主侵權”行為的人,卻因進口、持有、銷售、展示、分發侵權復制品或提供復制手段等而承擔的民事侵權責任。它與s.16(受限制行為)/s.17–s.21(主侵權的具體類型)并列,由s.22–s.26專章規定,本案涉及的間接侵權主要聚焦在s.22(進口)與s.23(持有/經營性交易/分發)上。
對于該主張,原告的核心法律邏輯鏈條如下:
(a)被告的Stable Diffusion模型權重(作為可下載的模型文件)可被視為“物品/物件”(article)。
(b)該“物品”已被“進口”到英國(例如,英國用戶從Hugging Face下載),或在商業過程中“分發”和“持有”(例如,通過DreamStudio平臺提供訪問)。
(c)該“物品”是一個“侵權復制品”(infringing copy)。其之所以是侵權復制品,不是因為它包含了Getty 的圖像副本(因為原告也承認,它主要是以數字和代碼構成的模型權重,不直接包含圖像副本),而是因為它精確地符合了CDPA s.27(3) 條的法律擬制測試的定義。
(d)s.27(3) 條的法律擬制測試定義是:一個物品,其在海外的“制作”(making)(即模型訓練過程),如果發生在英國,將會構成版權侵權(即原告最初指控的s.17下的大規模復制)。那么該物品就構成侵權復制品。
同樣的,原告對此主張的論證過程中,遇到了如下的細分論點或具體障礙,具體為:
論點 1:將無形的模型權重論證為“物品”(Article)
原告面臨的第一個障礙是被告的抗辯,即s.22與 s.23中的“物品”一詞僅指有形物體(如書籍),因為法規提到了“進口”“占有”和“分發”等具有物理內涵的行為。
原告提出了兩個關鍵論點來反駁這一點,主張“物品”也應包括無形物(如模型權重文件):
(1)“法律與時俱進”原則(The "Always Speaking" Principle):原告主張,1988年的《版權法》在解釋時必須被視為“與時俱進的(always speaking),以涵蓋自法案通過以來出現的技術發展。論點是,“現代存儲方法”(如無形的模型權重)在功能上等同于立法者最初意圖規制的“同類事實”(genus of facts)(即承載知識產權價值的媒介),即使在1988年無法預見其具體形式。
(2)引用先例(如 Sony v Ball):原告引用了諸如Sony v Ball這樣的先例。該案承認,電子媒介中(甚至是RAM芯片中)的“瞬時復制”(transient copies) 構成了s.17下的“復制”。原告的論證邏輯是:如果法律承認無形的電子復制品(intangible copy)是一種“復制品”,那么承載或構成該復制品的媒介(即使是無形的,如軟件文件)也必須被相應地解釋為“物品”(article)。
論點 2:將模型權重認定為“侵權復制品”(Infringing Copy)(s.27(3))
這是原告版權論證中最具創造性的法律論述,即原告試圖證明一個不包含任何復制品,主要由數字參數構成的模型權重,在法律上仍可被視為“侵權復制品”。
原告的論證嚴格依賴于s.27(3) 的法律擬制測試,即:“該物品的制作過程如果在英國發生,是否會侵權?”。制作Stable Diffusion模型權重的過程,就是訓練過程。該訓練過程涉及對數百萬張Getty 版權圖像進行反復的、系統性的復制和處理(例如,在VRAM中創建臨時副本以優化權重)。如果這個“制作”過程(即訓練)發生在英國,將會構成 s.17下的大規模版權侵權。因此,該過程的最終產品(即模型權重本身),根據s.27(3) 的明確措辭,在法律上被定義為侵權復制品——無論該最終產品是否在物理上保留了原始的侵權數據。
原告試圖通過這一論證,將“侵權”的法律屬性從“產品”(模型)轉移到“過程”(訓練)。這似乎是一個巧妙的法律策略,旨在解決生成式 AI 的“黑匣子”問題——即最終模型不包含可識別的訓練數據副本。原告主張,侵權復制(訓練數據)是制造該物品(模型)的“原材料”,因此該物品從誕生起就永遠帶有“侵權復制品”的法律原罪。
4.2 商標侵權與仿冒索賠
與因屬地管轄權問題而失敗的直接侵權訴請不同,Getty Images的商標侵權和仿冒訴請得以保留并推進至審判。這是因為商標侵權的侵權行為(即帶有水印的圖像的展示和供應)明確發生在英國用戶面前,無論模型在何處訓練。
核心事實指控:Stable Diffusion在響應某些提示詞時,會生成帶有扭曲但可識別的“GETTY IMAGES”和“ISTOCK”水印的合成圖像。如下圖:
![]()
![]()
原告的“使用”論證:原告主張Stability AI(而不僅僅是用戶)在“商業過程”(in the course of trade)中“使用”(use)了這些標志。其論證邏輯是:通過其DreamStudio和API平臺,Stability AI 提供了一項服務,該服務將標志“附加”(affixing) 到“商品”(合成圖像)上,并將這些商品供應給英國消費者。
(1)混淆可能性
原告主張,普通消費者特別是那些使用如DreamStudio這樣“技術含量較低”(原告認為)的平臺的用戶在看到這些水印時,不會認為它們是隨機的亂碼或幻覺。相反,他們會誤以為Stability AI與 Getty Images之間存在某種商業合作或聯系。
原告所聲稱的“混淆”具有特定的含義。其核心論點不是消費者認為該圖像來自Getty Images(即傳統的來源混淆),而是消費者更可能認為Stability AI已經獲得了Getty Images的許可來合法地訓練其模型,因此該水印是這種(虛假的)許可關系的證明。
對于該主張,原告提交了關鍵性證據:
(a)用戶的實際困惑:原告提供了從Reddit和Hugging Face等公共論壇收集的證據,顯示真實用戶對這些水印感到困惑。
(b)“日本寺廟花園”圖像:證據顯示,一名用戶在Hugging Face上發帖稱,在生成這些圖像時,“一半的圖像……都帶有一些看起來非常像灰色getty images印記的東西”,并詢問“是否有辦法在下一版本中將其訓練抹除掉?”。
![]()
(c)“兩個女孩擁抱”圖像:一個Reddit帖子顯示,用戶稱AI“試圖制作一個Getty images水印”,表明用戶將其識別為商標。
![]()
(d)原告用戶的工單信息:原告提供了其收到的用戶的一條工單消息作為關鍵證據。一名用戶在使用被告模型生成了iStock水印后,向Getty Images明確詢問:“……在我的項目中使用這些圖像是否合法?Stable Diffusion是如何向你們獲取材料許可的?”。該證據被用作支持其“許可混淆”論點的直接證據。
(2)聲譽損害(Tarnishment / 玷污)
原告聲稱Getty 商標(特別是Getty Images標志)的聲譽建立在“高質量”、“真實性”的視覺材料之上。被告的“使用”通過兩種方式損害了這一聲譽,這種損害至少包括:
(a)與低質量/虛假內容的關聯:將該商標與Stable Diffusion生成的低質量、扭曲(例如,有人物重疊或多余肢體)或明顯“虛假”的“非真實照片”相關聯。原告主張,這損害了其商標作為“真實照片或素材保證”的功能。
(b)與冒犯性內容的關聯:原告稱,其商標被與被告的Stable Diffusion生成的色情、暴力圖像和宣傳和一些低劣的圖片相關聯,從而玷污(tarnish)了其聲譽。如下圖,由于被告模型生成的圖片的低劣,形成了具有強烈恐怖意味的圖片。
![]()
(c)“麥莉·賽勒斯”(Miley Cyrus)圖像:在原告的取證過程中,通過使用包含“麥莉·賽勒斯”(Miley Cyrus) 和“新聞照片”(news photo)的提示詞,生成的圖像結果顯示,其不僅帶有扭曲的Getty水印,而且圖像本身是NSFW(Not Safe For Work“不宜在工作場所觀看”)的,例如生成顯示人物的“暴露著乳房”等。
原告以此證明,存在一種真實風險,即用戶(甚至是無意的用戶)可能會生成帶有Getty水印或商標的冒犯性色情內容,這對該商標的聲譽造成了損害。
(3)商標淡化損害(Dilution / 稀釋)
防止商標淡化的保護不以消費者混淆為要件,而是旨在保護有一定知名度商標本身的識別力和蘊含的消費者的正面評價,類似于商譽。
原告聲稱,被告在互聯網上傳播、擴散帶有Getty 標志的合成圖像(即使是扭曲的),會削弱該標志的顯著性。消費者將不再能夠立即將該標志與唯一的來源(Getty Images)聯系起來,從而稀釋和淡化其商標的來源識別的功能。
(4)仿冒(Passing Off)
首先要說明的是,在英國法律體系下,仿冒指控不同并獨立于商標侵權的指控,仿冒指控的法律基礎來源于普通法(Common Law),而非成文法(statutory law),其是一種侵權行為(tort),其背后所保護的法益是“商譽”(Goodwill)這一無形財產權。一般認為,仿冒指控需滿足三要素標準,即:(1)商譽(Goodwill):原告必須證明其業務(商品或服務)已經獲得了可辨識的商譽或聲譽;(2)虛假陳述(Misrepresentation):被告(有意或無意)向公眾作出了虛假陳述,導致或可能導致公眾混淆;(3)損害(Damage):原告必須證明其商譽因此虛假陳述遭受了實際損害,或極有可能遭受損害。
原告認為該主張可以與商標侵權訴請并行。原告指控被告的行為(通過其服務生成帶水印的圖像)構成了虛假陳述,向公眾暗示其業務與Getty Images的業務之間存在商業聯系或許可,但實際上這種聯系并不存在。而仿冒導致的損害,即上文所論述的,基于對原告商標造成的多重損害所導致的對原告商譽也造成了類似的損害。
5
總結
本文作為該案例分析的第一部分,聚焦在對原告訴請的分析,后續會再就被告抗辯和法院觀點進行詳細分析。
本案在英高院于2023年1月15日立案,是起訴AI模型或針對AI訓練的較早的典型,也是目前為數不多有法院判決的案例。因此,對于本案原告的訴請的評價,要考慮到本案所處的時間階段。原告訴訟策略和訴請值得稱贊的地方在于:首先,原告較早認識到“AI訓練”是一個籠統的概念,對其的判斷需要在版權法視角下,將該過程解構為一系列具體的行為來做分析,否則無法得出精確的結論。至少應分為數據獲取、訓練開發和輸出階段,不同階段下有不同的行為所對應不同的專有權,需要逐一判斷。這一做法也被后續類案的原告所采納,甚至對AI訓練的過程進行了更加細致的拆解。其次,本案原告對間接侵權和商標、仿冒侵權的訴請和論證邏輯具有創新性,也被后續類案所效仿,比如《紐約時報》等訴OpenAI的案件中,原告也將訴請擴展到商標領域,主張AI因幻覺而將產生虛假信息的來源歸因于原告,這個行為侵犯了原告商標權和商譽等。
但是,本案最終的結果對原告而言確實不如人意,一方面可以說原告將本案的主戰場寄希望于在美國法院提起的新的訴訟,另一方面也在于原告自己的訴訟策略的失誤,比如:首先,原告廣撒網的訴訟策略,每個訴請看似都有道理,但都背負著很大的舉證負擔,看似對被告全流程的指控,最后可能因為證據不足或者核心爭議的準備不足,而導致全盤皆輸。后續的很多案件起訴也吸取了本案的教訓,比如Nazemian v. NVIDIA案只將訴請聚焦在訓練數據來源的問題上。其次,原告的訴請多次陷入了循環論證的邏輯中,比如數據庫侵權的主張建立在版權直接侵權的成立上、對代表性訴訟的請求也建立在版權侵權的成立上、仿冒的主張建立在原告商標侵權指控的成立上等,這樣的論證邏輯導致在前的訴請被否定后,后續的訴請也很難得到支持。
(本文僅代表作者觀點,不代表知產力立場)
封面來源 | Pixabay 編輯 | 布魯斯 有得
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.