IT之家 2 月 8 日消息,2024 年,英偉達因為“用盜版圖書訓練 AI 模型”而被起訴。英偉達 1 月 29 日提交動議,要求加州聯邦法院駁回作家團體集體訴訟,堅決否認曾使用盜版書訓練 AI 模型。
在提交的駁回動議中,英偉達指出原告方(Nazemian 等作家)未能提供任何實質性證據證明其作品被下載或用于模型訓練,指控純屬推測。
針對原告指控英偉達員工內部討論過盜版書庫 Anna's Archive,英偉達辯稱“討論不等于實際使用”,且無證據表明涉訴作品被下載。
![]()
這起案件名為 Nazemian v Nvidia,由多名作者于 2024 年初提起,目前由加州北區聯邦法院法官 Jon Tigar 審理。原告主張英偉達的 AI 工具與參考模型在訓練過程中使用了受版權保護的書籍,并稱這些書籍來自所謂“影子圖書館”,包括 Anna's Archive 以及 Books3 等來源。在原告提交的修訂版起訴書中,他們進一步加入了新的理論、數據集與模型指控,并援引內部討論內容稱英偉達員工曾就是否能訪問 Anna's Archive 進行確認,試圖以此作為英偉達非法獲取版權書籍的證據。
但在 1 月 29 日提交的駁回動議中,英偉達明確表示,修訂后的起訴書仍未滿足版權侵權訴訟所需的最基本要件。英偉達稱,原告沒有提出事實來證明英偉達復制了他們的具體作品,也沒有說明復制發生的時間、方式,或哪些模型包含這些作品。英偉達認為,在缺乏這些關鍵細節的情況下,原告的主張只能被視為推測性指控。
圍繞 Anna's Archive 這一爭議點,英偉達指出,即便起訴書描述了內部討論或對該網站訪問可能性的詢問,也不等同于公司實際下載或獲取了原告作品。英偉達強調,討論或評估潛在數據來源并不構成版權法意義上的復制行為,而版權侵權訴訟要求原告必須在起訴階段就提出足以支持“復制受保護作品”的事實依據。英偉達表示,在現有指控下,“合理的解釋是英偉達并未獲取原告作品”。
英偉達還批評原告大量依賴“基于信息與信念”的表述方式,認為這種做法試圖以取證程序替代起訴階段應完成的事實陳述。英偉達在動議中提醒法院,版權原告必須在進入證據開示前就提出侵權事實,而不能通過訴訟先行啟動開示,再借此確認是否存在侵權。
除 Anna's Archive 外,英偉達也試圖縮小案件范圍,反對原告在修訂起訴書中新增的多個數據集與模型指控,包括加入對 Megatron 345M 等內容的討論。英偉達認為原告將多個模型與工具“打包式”指控,卻沒有解釋任何特定模型如何使用原告作品進行訓練。英偉達還在動議中引用其公開文檔,稱原告對訓練數據來源的推斷與公開資料存在矛盾。
修訂起訴書還提出了另一條“間接責任”路徑,試圖將英偉達的 NeMo Megatron 框架與其支持下載公共大規模數據集(如 The Pile)的能力納入責任范圍。對此英偉達回應稱,起訴書并未指稱任何第三方實施了直接侵權行為,而這是主張幫助侵權或替代責任所必需的前提條件。英偉達強調,提供可選工具本身并不能自動構成侵權責任,除非原告能夠提出具體事實證明用戶確實利用這些工具實施了版權侵權。
根據動議內容,該駁回請求預計將于 2026 年 4 月 2 日在美國加州北區聯邦法院舉行聽證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.