刻在石頭上的碑文會(huì)風(fēng)化,寫在紙上的文字會(huì)被遺忘,千百年來如何保存信息一直是人類文明的難題。直到互聯(lián)網(wǎng)的出現(xiàn),它成為了一個(gè)被認(rèn)為保存信息的絕佳載體,“互聯(lián)網(wǎng)是有記憶的”也一度成為共識(shí)。
![]()
然而在2015年,TCP/IP協(xié)議和互聯(lián)網(wǎng)架構(gòu)的聯(lián)合設(shè)計(jì)者之一、時(shí)任谷歌副總裁的溫特·瑟夫拋出了一個(gè)驚人的觀點(diǎn)。他認(rèn)為隨著數(shù)字技術(shù)的不斷迭代演化,人類保存在互聯(lián)網(wǎng)上的圖片、文檔、文件等信息可能會(huì)徹底丟失,在進(jìn)入一個(gè)“數(shù)字黑暗時(shí)代”后,未來的人類或許根本就沒有關(guān)于21世紀(jì)的歷史記錄。
作為互聯(lián)網(wǎng)行業(yè)的先驅(qū)者,溫特·瑟夫并非嘩眾取寵,他的擔(dān)憂在過去十年間正一步步成為現(xiàn)實(shí)。
此前在2023年,美國著名智庫皮尤研究中心發(fā)布了一份報(bào)告,顯示截至2023年10月,2013年至2023年期間存在的網(wǎng)頁中有25%已處于“404 Not Found”狀態(tài)。到了2024年,谷歌、百度、必應(yīng)這三大搜索引擎也陸續(xù)取消了網(wǎng)頁快照功能。
以往互聯(lián)網(wǎng)信息的散佚往往來源于平臺(tái)方因成本問題主動(dòng)放棄,可最近發(fā)生的事情,讓“數(shù)字黑暗時(shí)代”有了從“寓言”變成“預(yù)言”的征兆。日前《連線》雜志的報(bào)道顯示,《USA Today》《紐約時(shí)報(bào)》《衛(wèi)報(bào)》等多個(gè)知名媒體開始屏蔽互聯(lián)網(wǎng)檔案館旗下的時(shí)光機(jī) (Wayback Machine) 快照功能,不再允許后者抓取他們的頁面并將其存檔。
![]()
《連線》在文中舉了一個(gè)讓人哭笑不得的例子,《USA Today》不久前曾刊發(fā)了一篇揭露美國移民與海關(guān)執(zhí)法局如何拖延披露其拘留政策影響的報(bào)道,就正是基于互聯(lián)網(wǎng)檔案館“時(shí)光機(jī)”抓取的數(shù)據(jù)。對(duì)此互聯(lián)網(wǎng)檔案館負(fù)責(zé)人馬克·格雷厄姆對(duì)此吐槽道,“他們能完成這篇調(diào)查報(bào)道正是因?yàn)椤畷r(shí)光機(jī)’的存在,可他們卻在封禁訪問權(quán)限。”
《USA Today》發(fā)言人拉克-瑪麗 · 安東表示,此舉并非專門針對(duì)互聯(lián)網(wǎng)檔案館,而是該機(jī)構(gòu)全面封禁所有爬蟲程序的舉措之一。《衛(wèi)報(bào)》商務(wù)與授權(quán)總監(jiān)羅伯特·哈恩的解釋則是,“擔(dān)憂人工智能公司可能濫用為存檔目的抓取的內(nèi)容。”據(jù)不完全統(tǒng)計(jì),目前已有23家主流新聞網(wǎng)站屏蔽了互聯(lián)網(wǎng)檔案館為“時(shí)光機(jī)”使用的網(wǎng)絡(luò)爬蟲“ia_archiverbot”。
![]()
作為全球最知名的非營利性網(wǎng)站,互聯(lián)網(wǎng)檔案館是網(wǎng)民們了解互聯(lián)網(wǎng)歷史的最有效工具,這也導(dǎo)致它在過去幾年麻煩纏身。早在2023年,互聯(lián)網(wǎng)檔案館就曾因致力于保護(hù)黑膠唱片錄音數(shù)據(jù)的“Great 78項(xiàng)目”,被索尼等唱片巨頭發(fā)起版權(quán)訴訟。最終這些唱片巨頭們得償所愿,數(shù)千份數(shù)字化錄音被下架。此次這些新聞媒體同樣是打著版權(quán)保護(hù)的旗號(hào),拒絕互聯(lián)網(wǎng)檔案館收錄“網(wǎng)絡(luò)記憶”。
那么問題就來了,新聞媒體的數(shù)字化是從本世紀(jì)初開始,而互聯(lián)網(wǎng)檔案館收錄媒體的網(wǎng)頁已經(jīng)有超過二十年的歷史,為何到2026年這些媒體才想起來保護(hù)版權(quán)呢?從某種意義上來說,互聯(lián)網(wǎng)檔案館這次是遭遇了無妄之災(zāi),因?yàn)檫@些新聞媒體真正想要封禁的是AI廠商的爬蟲。
關(guān)于新聞媒體與OpenAI、Anthropic、Perplexity等AI廠商進(jìn)行版權(quán)訴訟的報(bào)道,如今在互聯(lián)網(wǎng)上已經(jīng)隨處可見,但由于押注AI已然成為各國的策略,就使得版權(quán)大棒砸在AI廠商身上只是不疼不癢,也導(dǎo)致新聞媒體用法律來保護(hù)自己的資產(chǎn)不被AI廠商利用變得徒勞無功。
![]()
在無法阻攔旗下記者、編輯、專欄作家產(chǎn)出的高質(zhì)量內(nèi)容成為訓(xùn)練AI大模型語料的情況下,新聞媒體的思路也發(fā)生了變化。既然自己的內(nèi)容不可避免地會(huì)蛻變?yōu)榻g索,他們選擇將絞索賣一個(gè)好價(jià)錢,也就是與OpenAI等AI廠商合作。
畢竟將內(nèi)容賣給AI廠商是飲鴆止渴、殺雞取卵,終有一天AI大模型的寫作能力將超越人類。可是放任互聯(lián)網(wǎng)檔案館將自家內(nèi)容免費(fèi)公開在互聯(lián)網(wǎng)上,新聞媒體連眼前的利益都拿不到,自然也就顧不上互聯(lián)網(wǎng)檔案館為全球網(wǎng)民提供的公共利益了。
只能說AI大模型技術(shù)確實(shí)當(dāng)?shù)闷稹癆I的iPhone時(shí)刻”,也真真切切改變了互聯(lián)網(wǎng)世界的運(yùn)行方式。未來“建墻”或?qū)⒊蔀樾碌某B(tài),在某種意義上,Web 3的去中心化理想、創(chuàng)作者經(jīng)濟(jì),正在以一種面目全非的方式變?yōu)楝F(xiàn)實(shí)。
【本文圖片來自網(wǎng)絡(luò)】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.