![]()
11月10日,維基百科的運營機構維基媒體基金會發布了一份聲明,希望開發者能夠“負責任地”使用其龐大的知識庫。基金會明確提出兩項核心要求:
第一,停止使用自動化程序直接抓取網站數據,因為這種行為嚴重消耗其服務器資源;
第二,轉而采用其專為大規模數據使用設計的付費產品 ——“維基媒體企業平臺”。此舉旨在建立一個更可持續、互惠互利的合作模式。
這是它第一次以官方立場、明確語氣介入AI行業對公共數據的使用問題。也是一次不加掩飾的反擊。
過去半年,維基百科發現其站點流量出現異動。在5月和6月,一些“看起來像人類用戶”的訪問行為,實則由AI爬蟲程序生成。它們反復調取內容,繞開現有接口,假裝正常用戶行為,卻在背后大規模抓取數據。
同時期,“人類用戶”的頁面訪問量同比下滑了8%。這不是一個可忽視的數字。維基百科的存續機制依賴兩樣東西:瀏覽量帶來的捐贈,以及活躍用戶轉化為的內容編輯者。訪問下降,意味著志愿者供給減少,也意味著與公眾的聯系在削弱。
這也是基金會決定“開口”反擊的原因。
維基百科對AI公司提的要求,并不復雜。不要再白用。請開始付費。
據了解,這背后有一條長期以來默許的供需關系:AI模型的基礎訓練數據,大量來自維基百科。它有良好的結構化寫作、事實鏈清晰、來源標注完整,也有開放協議與自由版權。
這使得維基百科在AI訓練數據中的“性價比”極高。相比復雜、模糊的社交媒體語料,維基百科是AI時代最被依賴的公共知識資源之一。模型在回答用戶問題時,也頻繁直接調用維基百科頁面內容的改寫版本,甚至逐字照搬。
但這份依賴并未反哺給它。AI公司沒有支付費用,也沒有標注來源,更沒有為數據維護和知識更新承擔任何成本。
維基百科的擔憂是:它為整個AI行業提供了底層知識供給,卻正在被反過來抽空用戶基礎。
這是一個明顯的“搭便車”問題,大型模型的運行者得到了成本極低的數據獲取路徑,卻把訪問者從維基百科原站點“導走”,這種結構性不對稱,一旦持續,對維基百科這樣的非營利型組織是致命的。
為此,維基媒體基金會提出了“維基媒體企業平臺”作為解決方案。
據IT之家報道,這是一個采用自愿選擇模式的付費 API 產品,它不僅為 AI 公司提供了穩定、高效的數據接入方式,避免了因直接抓取而給維基百科服務器帶來的巨大壓力,其商業收入將直接用于支持維基百科的非營利使命。通過這種方式,AI 公司在使用數據的同時,也為知識的創造與維護做出了貢獻。
另一個被強調的是內容“歸屬感”問題。
維基媒體基金會還強調:為了讓公眾信任互聯網上的信息,平臺必須清楚地標明信息來源。
對于使用維基百科內容訓練或生成結果的 AI 模型而言,提供明確的來源歸屬,是對背后數百萬人類志愿者貢獻的基本尊重。如果訪問量持續減少,志愿者和捐贈者的生態系統將受到侵蝕,最終損害這個全球最大在線百科全書的內容質量與更新速度。
隨著AI生成內容快速增長,內容的“來處”變得越來越模糊。用戶看到的是答案,不再知道答案的出處。這種“出處被抹除”的后果是:平臺獲得收益,模型獲得能力,但內容生產者被排除出分配鏈條。
從維基百科的“喊話”開始,一種新的內容分配邏輯正在被討論。AI不只是知識的使用者,也正在成為平臺層級的“再分配者”。
今天,它靠知識訓練模型,明天,它就可以成為搜索的替代品。它取代的不只是用戶訪問路徑,也正在重寫內容信用體系。
維基百科此時的聲明,并不是一場情緒宣泄,而是一次邊界設定:開放知識不是免費的礦;模型訓練不能成為合法的掠奪。
這一立場是否會被主流AI公司接受還不確定,但可以肯定的是,隨著AI規模不斷擴大,對公共資源的依賴也將變成一項必須回應的“公共成本”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.