![]()
*此節目由豆包AI播客生成
硅谷這波AI人才爭奪戰里,扎克伯格是最務實的。他從不跟想挖的人談什么理想,各大科技公司的華裔人才,小扎動輒開價一兩億美元。
乃悟看到最極端的案例,是他花了148億美元買了AI數據標注公司Scale AI 49%的股份,不要董事會席位,不要投票權。只有一個附加條件:
CEO王先生全職加入Meta出任首席AI官。
在美國的AI圈子里,Meta已經落后于OpenAI和谷歌之類的第一梯隊,以前小扎靠開價打法搞定過Instagram、Whatsapp等等,現在他又祭出了這一招。
要All in AI不是什么稀奇事,畢竟百度的Robin也喊了很多年了,乃悟就研究了一下花了這么多錢的Meta這些年在AI領域有啥進展,專業的咱就不說了,說點有意思的。
7月23日,Meta的法務部門接到了一份來自加州北區聯邦法院的傳票,兩家美國的成人視頻公司strike3和counterlife把它們告了。
按照原告的說法,從2018年開始,Meta就開始用BT工具從這倆網站下載各種語言和不同清晰度版本的愛情動作電影,而且往往是電影首發當天就下載,數量多達:
2396部!
倆公司向法院提交了各種證據,比如通過工具檢測后發現,下載地址都指向Meta的IP,其中一個IP還是Meta員工自己家里。
更讓倆公司憤怒的是,因為BitTorrent的特性是并行下載的人越多,速度越快,Meta居然還做種分發!
Meta為啥要下載這么多愛情動作電影,甚至員工還自愿加班回家繼續下載?兩家公司懷疑Meta是用這些素材:
訓練AI。
我的媽啊,我就知道我的硬盤不養閑片,儲存的都是人工智能的未來啊!
按照strike3的說法,Meta之所以選擇他們的成人視頻,主要是因為他們家的清晰度高、主題統一、畫面連貫,是訓練AI,特別是生成類視頻模型的好素材。
Strike3還指責,為了掩蓋這些素材都是盜版,Meta還架設了虛構的服務器,他們曾經向Meta去函警告,Meta依舊我行我素。忍無可忍的他們這才將Meta告上了法庭。
Meta方面否認了這些指控,不過外媒預測,Meta應該會選擇庭外和解。
這是全球第一起關于成人影片和AI數據的版權糾紛,但卻不是LLM大模型們第一次惹上版權糾紛,甚至不是Meta的第一次。
此前不久,法院剛剛判決了一起和Meta有關的侵權案。起因是一堆美國作者把Meta告上法院,狀告他們利用盜版書訓練AI,數量多達700多萬本。原告稱,Meta使用LibGen之類已經被聯邦法院封禁的影子圖書館,做種下載圖書,訓練自家AI。
根據Meta的內部備忘錄顯示,他們甚至記錄了盜版書存在的錯印、漏印等問題。有Meta的員工爆料,他曾經問過同事,這事兒問過法務了嗎?同事回復,別家都這么干,所以咱們也這么干。
這個爆料人一看就是新人,有些事兒法務不讓干你就不干了?FBI天天警告你,有用嗎?
扎克伯格當時也出庭了,說他對此毫不知情。但內部文件卻顯示,這些都得到了扎克伯格的允許。
最后,在Meta律師團隊的努力下,法院駁回了原告的上訴,理由是Meta訓練的AI屬于合理運用,原告的證據不足。
不過,研發了Claude的Anthropic就沒這么好運了。他們也因為使用盜版書而被告上法院,負責審理此案的法官Alsup認為,買書來訓練Claude沒問題,但用盜版就是你們的不對了。何況你們下載這些盜版書籍:
未必真的就只是用來訓練AI。
Anthropic的立即上訴請求也被駁回,外媒預計他們可能面臨數十億美元的賠償。
這個法官好,strike3和counterlife能不能申請讓他來審愛情動作片訓練AI的案子。
乃悟查了一下,至今為止,沒有任何一家大模型徹底說清楚自己的訓練素材到底是哪兒來的。各家回答都差不多,什么我們數據都是網上的公開資料、書籍和新聞。
更有甚者,如OpenAI等公司還拒絕透露數據的詳細來源。
乃悟試了試問了幾個國內大模型,他們的回答都如出一轍,什么保證合規啊,來自公開渠道和合作伙伴啊。但你進一步問,你的合作伙伴都有些誰?舉一個例子就行。他們就沉默了。
乃悟試了試,國內很多大模型都能精準識別哈利波特中的章節原文。甚至可以整章整章背出英文原文。還特別注明:
未刪減。
據乃悟所知,JK羅琳的版權還沒到期吧?
![]()
背點盜版書算什么本事,有能耐你也讓FBI警告我一下子。
關注星球視頻號,熟知寰宇人間事
加乃悟微信:yangnw0705 備注公司-職業
給我一個在看,我能撬動整個星球
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.