過去,AI 訓練的爭議只有一個問題:用得合不合理?
現在,美國法院開始換一個問法:你有沒有資格用?
2025年12月23日, YouTube 創作者聯盟,繞開版權侵權,直接動用一條被冷落多年的老法——DMCA §1201,把 AI 訓練攔在了“數據入口”之外。
這是美國 AI 訴訟里出現了一個非常有意思的變化。于是,一個現實問題擺在所有人面前:DMCA §1201,到底能不能管 AI 訓練?
一、先把 DMCA §1201 講清楚:它到底在管什么?
DMCA §1201 的核心只有一句話:禁止未經授權,規避對受版權保護作品所采取的“技術保護措施”。
注意,這里有四個關鍵詞:
1.技術保護措施(TPM)
2.規避(circumvention)
3.未經授權
4.與版權保護“有效相關”
它不是在保護作品內容本身,而是在保護——“進入作品的防盜門”。
二、為什么它突然在 AI 訓練中變得“好用”了?
原因只有一個:AI 訓練,天然繞不開“規模化獲取內容”。
而規模化獲取,幾乎必然會觸碰:
●登錄限制
●API 限制
●反爬蟲機制
●DRM / 加密
●平臺訪問控制
一旦你為了“拿數據”,繞過了這些版權保護機制,DMCA §1201 就有了出手的空間。具體到前文提到的訴訟有個有意思的細節。在字節案中,原告怎么證明“字節真的用過我的 YouTube 視頻訓練模型?”
答案來自一個非常經典、但經常被忽視的證據來源——
被告自己寫的論文。 關鍵證據,來自字節員工公開論文。
在論文 《MagicVideo: Efficient Video Generation With Latent Diffusion Models》 中,字節員工明確披露:
●使用了 HD-VILA-100M 數據集
●用于訓練其視頻生成模型 MagicVideo
而這個數據集,是微軟亞太研究院在 2022 年發布的。
HD-VILA-100M是什么?
一個包含約 330 萬個 YouTube 視頻的大規模公開視頻數據集。而這些視頻,大量來自普通創作者,并未單獨授權用于 AI 訓練。
于是,原告完成了一個非常關鍵的推理閉環:
論文披露的數據集 → 數據集來源于 YouTube → 視頻受平臺技術措施保護 → 訓練前必然存在規避行為,這正是DMCA §1201 所瞄準的核心。
三、適用邊界1:必須存在“有效的技術保護措施”
這是 §1201 的第一道硬門檻。如果是下述三種情況:
●公開網頁,任何人無需登錄即可訪問
●沒有訪問頻率限制、沒有技術阻斷
●單純的“使用條款禁止”,但無技術配合
法律結論:只有文字表述,沒有“技術措施”,§1201 很難適用。
在既有判例框架下,以下情形通常會被認為是 TPM(技術保護措施):
●登錄 / 賬號驗證機制
●加密、DRM
●API key + 訪問限制
●反爬蟲(IP 封禁、速率限制等)
在 AI 訓練案件中,YouTube 的技術體系正是權利人重點抓住的對象。
四、適用邊界2:必須存在“規避行為”,而非合理使用
這是 §1201 的第二道門檻。
一個關鍵區分:“使用了受保護內容” ≠ “規避了技術措施”
舉例:
●你通過正常賬號觀看視頻,不算規避
●你用工具批量下載、繞過速率限制,這是高風險行為
在 AI 訓練語境下,原告通常會主張:
模型訓練前的數據抓取,本身就需要繞過平臺為“人類用戶”設計的訪問限制。這正是爭議焦點所在。
五、適用邊界3:AI 訓練是不是“與版權保護有關”?
這是 §1201 在 AI 案件中最核心、也最有爭議的一點。
被告最常見的抗辯是合理使用:
“我們不是為了看作品,也不是為了傳播作品,我們只是為了訓練模型。”但在 §1201 條款下,法院關注的不是你的主觀目的,而是:你客觀上是不是繞開了權利人的技術保護措施。
如果答案是“是”,那么即便你的最終用途是 AI 訓練,也不排除 §1201 的適用。
六、適用邊界4:fair use,在 §1201 里幾乎沒用
這是很多人最容易踩坑的地方。
在版權侵權案件中,fair use 是“王牌抗辯”;
但在 §1201 框架下——fair use 通常不是有效抗辯理由。
美國法院長期以來的態度是:
●§1201 是獨立于版權侵權的責任
●即便最終使用可能是 fair use
●規避行為本身,仍可能違法
這也是為什么原告喜歡這條路徑。
七、適用邊界5:例外條款,但對 AI 很不友好
DMCA§1201 當然也有例外,比如:
●安全研究
●逆向工程
●無障礙訪問
●圖書館 / 教育用途
但現實是:這些例外,幾乎都很難自然覆蓋商業 AI 訓練。
尤其是當:
●訓練目的具有商業性
●數據規模巨大
●與產品直接相關
法院往往會采取非常保守的解釋。
八、總結一句話版“適用邊界地圖”
如果用一句話總結 DMCA §1201 在 AI 訓練中的適用邏輯,那就是:它不管你“學到了什么”,它只管你“是怎么拿到的”。可以適用的典型場景:
●受保護平臺
●存在明確技術訪問控制
●為規模化訓練繞過技術限制
難以適用的場景
●完全公開、無技術門檻的數據
●合法授權 / API 合規調用
●無“規避”事實,僅存在用途爭議
九、寫在最后
DMCA§1201 的真正意義,并不在于:“它能不能一錘定音 AI 侵權。”而在于,它正在改變一個根本問題:AI 訓練,不再只是“用得合不合理”,而是“你有沒有資格用”。
當規則從“使用結果”前移到“獲取路徑”,AI 產業的合規邏輯,也必須隨之整體前移。
這是這條“老法條”,在 AI 時代被重新喚醒的真正原因。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.