![]()
這可能是中國互聯網最貴的一次“Ctrl+C”和“Ctrl+V”了。最近百度把兩家公司告上了法庭,法院一錘定音:判賠1500萬。
很多人第一反應是:不就搬運點百科嗎?至于這么狠?
![]()
連“錯別字”都搬運走了
這次百度能贏,是因為在法院上甩出了幾條讓對方啞口無言的鐵證。
字X和3X旗下的百科為了趕進度,用了最簡單粗暴的招數——爬蟲抓取。他們不僅抓文字,連百度的目錄結構、參考資料、甚至連百度水印都原封不動地搬了過去。
- 所以這次百度在法院上甩出鐵證:
- (1)帶著百度百科特有的防偽水印
- (2)含有內部識別代碼
- (3)百度編輯留下的錯別字
- (4)已經過期的參考資料鏈接
都被原封不動地照搬過去。更荒誕的是,一些早已失效的政策鏈接、過時的參考資料,也赫然出現在對方頁面上。
這說明:這些百科的內容根本沒人看,純靠機器搬運過去了。
1500 萬是怎么判出來的?
互聯網有個潛規則叫Robots協議,相當于“我家門沒鎖,但你別進來”。這次法院判定,360和字節故意繞開這個協議,不打招呼就去搬運,性質變了,這叫“不正當競爭”。
以前這種官司賠幾十萬頂天了。但這回百度出了奇招:我建一個詞條要花多少人力、服務器、審核費、按【單價+抓取數量】計算,賠償額瞬間從“幾十萬”變成了“1500萬”。
- 法院看來也認可了這樣一條思路:
- (1)百科詞條不是網友隨便寫寫
- (2)背后有長期的人力審核、服務器維護、內容編輯成本。
- (3)你抓走我的詞條,相當于省掉了你自己本該投入的研發成本
之前抖音百科被判賠 800 萬,涉及詞條大約60萬條,這次沒有公布具體,但能感覺出來:這次不是版權糾紛了,這是在給整個互聯網內容版權重新定價。
為什么偏偏是這兩家被起訴?
一個是被百度壓過的老對手,一個是急著給平臺找口糧的新玩家。
- 大概是2013年,360剛做搜索,結果發現搜出來的全是百度百科的鏈接,老周肯定不干啊。于是360就決定:搜索必須有自己的“百科”,于是360百科就出現了。
![]()
- 而字節真正入局百科,大概是在 2019 年。他們直接收購了【互動百科】改名叫【頭條百科】,收購之后今日頭條、抖音的評論區、搜索框都成了互動百科的底座。后來改名叫【快懂百科】,再后來又改名叫【抖音百科】。
![]()
這百科這家公司的主體一直放在【天津三XXX公司名下】。
這是互聯網大廠常見的一種做法:把高風險、有問題大業務,都子公司去做,出了事也不會影響到公司的主體。所以這次百度只能起訴「奇某公司」「三某公司」。
百科,是AI時代最頂級的中文語料,沒有之一
百度百科做了20 年了,詞條數 2700 萬+。他的權重非常高,尤其是Google上,大部分內容都有百度百科的影子。
而現在的文心一言、豆包、360 AI,都在搶高質量、結構化、可直接訓練的大規模中文數據。所以他們不約而同的開始抓取百科內容。
百度心想,你搶我用戶,我還能忍;你拿我的數據去喂你的 AI,那就是斷我后路。過去 10 年,百度靠百科喂搜索;未來10年,百度要靠百科成就AI。
所以這一次,必須下死手。
過去我們總覺得:網上內容誰都能用,抄一點不算啥,反正都是網友寫的。但這次的1500萬,直接把大廠們多年來心照不宣的“白嫖思維”給干碎了!
![]()
盧松松是一位自媒體人、短視頻博主。也是創業者必看的賬號,關注草根創業圈、科技互聯網、自媒體和短視頻行業。感謝您的關注!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.