近日,李開復(fù)投資的零一萬物公司被爆[i]其大模型“Yi”使用了Facebook母公司META的LLaMA大模型(全稱為"Large Language Model META AI")的開源代碼,對外卻沒有提及。套殼卻不說明的做法引來了大量質(zhì)疑。對此,該公司致歉稱:正在各開源平臺重新提交模型及代碼并補(bǔ)充LLaMA協(xié)議副本的流程中。該公司負(fù)責(zé)人表示公司不存在抄襲問題。今天就來跟大家聊聊,法律上,這種行為算不算抄襲?法律后果還有哪些?
先說結(jié)論。我國《著作權(quán)法》規(guī)定:署名權(quán),即表明作者身份,在作品上署名的權(quán)利。所謂的抄襲,就是侵犯署名權(quán)的行為。零一萬物的軟件使用公司的源代碼卻不標(biāo)來源,讓別人看起來這部分內(nèi)容是他們自己開發(fā)的,確實(shí)涉嫌侵犯署名權(quán),也就是涉嫌抄襲。哪怕是他們是疏漏造成的,侵犯署名權(quán)也沒跑。至于法律后果,我們要切換一個視角,要從LLaMA的著作權(quán)人META公司看,他們被侵了哪些權(quán),就知道了。
一、著作權(quán)人META公司的權(quán)利
META公司雖然公開了LLaMA2的代碼,但其在軟件協(xié)議[ii]中做了多項(xiàng)保留,摘幾點(diǎn)大家看看:
1. 制作發(fā)行 Llama 材料或任何衍生作品,如果可供第三方使用,應(yīng)向該第三方提供本協(xié)議的副本。并且公示權(quán)利標(biāo)識:“LLaMA 2 已根據(jù) LLaMA 2 社區(qū)許可證獲得許可,版權(quán)所有 (c) META Platforms, Inc. 保留所有權(quán)利。”
2. 不得使用將 Llama用于改進(jìn)任何其他大型語言模型,但LLaMA 2或其衍生作品除外。
3. META對月活7億用戶的授權(quán)做了保留。如果被許可人使用LLaMA 2開發(fā)的軟件產(chǎn)品月度活躍用戶超過7億人的,則被許可人應(yīng)在此前的一個月向META申請代碼許可授權(quán),META有權(quán)自行決定是否進(jìn)行授權(quán),在META授權(quán)之前,被授權(quán)人無權(quán)行使任何權(quán)利。
以上條款是否有效?當(dāng)然有效。Llama 2的軟件著作權(quán)屬于META,公開源代碼時對權(quán)利進(jìn)行保留,只要不違反法律規(guī)定,也是其合法權(quán)利。另外,筆者查了一下,OpenAI[iii] 用戶協(xié)議Claude[iv]用戶協(xié)議中均含有不得用其服務(wù)改進(jìn)競爭對手產(chǎn)品的條款,但Google Bard[v] 和文心一言[vi]的用戶協(xié)議則沒有此類條款。
因?yàn)閷κ跈?quán)進(jìn)行了限制,所以雖然META公開了LLaMa 2的源代碼,但開源軟件機(jī)構(gòu)Open Source并不認(rèn)為這種做法屬于開源,他們還特地發(fā)了個文章[vii]做了個說明:因?yàn)殚_源許可證不應(yīng)歧視個人、團(tuán)體或工作領(lǐng)域。而META對 LLaMa 模型和代碼的許可時對月活超過7億用戶的開發(fā)者,以及用LLaMa改進(jìn)其他大型語言模型做了授權(quán)限制,因此不符合開源標(biāo)準(zhǔn)。
二、零一萬物公司有什么法律責(zé)任
筆者查了下零一萬物公司的用戶協(xié)議[viii],其并未包含META對LLaMA 2軟件協(xié)議中的限制,其也沒有公示其大模型是使用LLaMA 2的代碼進(jìn)行了改編(目前已做部分修改)。所以首先涉嫌侵犯署名權(quán),這個前文已述。其次,LLaMA 2的軟件協(xié)議對被授權(quán)人授權(quán)的前提條件是要公示權(quán)利標(biāo)識:“LLaMA 2已根據(jù)LLaMA 2社區(qū)許可證獲得許可,版權(quán)所有 (c) META Platforms,Inc. 保留所有權(quán)利。”
如果沒有公示的,可以視為被授權(quán)人沒有滿足授權(quán)條件,所以其二次開發(fā)及發(fā)布均涉嫌侵權(quán),二次開發(fā)侵犯META公司的軟件修改權(quán),發(fā)布修改后的源代碼及編譯后的目標(biāo)程序,則侵犯META公司的軟件信息網(wǎng)絡(luò)傳播權(quán)。
同時,如果零一萬物公司不承認(rèn)套殼的,也就不能算LLaMA 2的衍生作品,會同時違反“不得使用將 Llama用于改進(jìn)任何其他大型語言模型,但LLaMA 2或其衍生作品除外”的用戶協(xié)議規(guī)定。
三、使用零一萬物代碼開發(fā)衍生作品者的法律風(fēng)險
如果第三方開發(fā)者不了解情況,使用了零一萬物公司隱匿來源的代碼做再次開發(fā)的,同樣會因?yàn)槭芰阋蝗f物公司的牽連,面臨侵權(quán)法律風(fēng)險。定性上,零一萬物公司的法律風(fēng)險,第三方開發(fā)者都有,只是如果不明知,侵權(quán)的性質(zhì)就沒有那么嚴(yán)重。
對零一萬物公司侵權(quán)代碼再次開發(fā)(含三次開發(fā)、四次開發(fā)……)的作品代碼如果包含LLaMA 2代碼的,首先會侵犯META的署名權(quán),其次是META公司的軟件修改權(quán),發(fā)布修改后的源代碼及編譯后的目標(biāo)程序,則侵犯了META公司的軟件信息網(wǎng)絡(luò)傳播權(quán)。
LLaMA英文對應(yīng)的是一種可愛的動物——美洲大羊駝,也就是中國網(wǎng)民俗稱的“草泥馬”。中文俗稱雖然有點(diǎn)粗俗,但LLaMA的軟件協(xié)議雖然對使用有限制,但規(guī)定其實(shí)并不嚴(yán)厲,如果像筆者之前介紹的《用GitHub上的開源代碼訓(xùn)練人工智能違法嗎?》[ix]一文中提到的,是用了GPL協(xié)議項(xiàng)下的代碼而不標(biāo)識的,法律風(fēng)險會更大。總之,我們對公開源代碼軟件的態(tài)度應(yīng)該需要更加嚴(yán)謹(jǐn),要用別人的代碼,就應(yīng)該遵守別人的開源協(xié)議,否則,不但自己可能侵權(quán),還會連累用你產(chǎn)品開發(fā)衍生產(chǎn)品的人。
本文作者:游云庭,上海大邦律師事務(wù)所高級合伙人,知識產(chǎn)權(quán)律師。本文僅代表作者觀點(diǎn)。
[i] https://www.sohu.com/na/737188391_161795
[ii] https://github.com/facebookresearch/llama/blob/main/LICENSE
[iii] https://openai.com/policies/business-terms
[iv] https://console.anthropic.com/legal/terms
[v] https://policies.google.com/terms/generative-ai/use-policy
[vi] https://wenxin.baidu.com/AIDP/wenxin/Yl6th25am
[vii] https://blog.opensource.org/Metas-llama-2-license-is-not-open-source/
[viii] https://huggingface.co/01-ai/Yi-6B/blob/main/LICENSE
[ix] https://mp.weixin.qq.com/s/1TTkYh2yJZgd_CSCbtdgkw
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.