近日,李開復投資的零一萬物公司被爆[i]其大模型“Yi”使用了Facebook母公司META的LLaMA大模型(全稱為"Large Language Model META AI")的開源代碼,對外卻沒有提及。套殼卻不說明的做法引來了大量質疑。對此,該公司致歉稱:正在各開源平臺重新提交模型及代碼并補充LLaMA協議副本的流程中。該公司負責人表示公司不存在抄襲問題。今天就來跟大家聊聊,法律上,這種行為算不算抄襲?法律后果還有哪些?
先說結論。我國《著作權法》規定:署名權,即表明作者身份,在作品上署名的權利。所謂的抄襲,就是侵犯署名權的行為。零一萬物的軟件使用公司的源代碼卻不標來源,讓別人看起來這部分內容是他們自己開發的,確實涉嫌侵犯署名權,也就是涉嫌抄襲。哪怕是他們是疏漏造成的,侵犯署名權也沒跑。至于法律后果,我們要切換一個視角,要從LLaMA的著作權人META公司看,他們被侵了哪些權,就知道了。
一、著作權人META公司的權利
META公司雖然公開了LLaMA2的代碼,但其在軟件協議[ii]中做了多項保留,摘幾點大家看看:
1. 制作發行 Llama 材料或任何衍生作品,如果可供第三方使用,應向該第三方提供本協議的副本。并且公示權利標識:“LLaMA 2 已根據 LLaMA 2 社區許可證獲得許可,版權所有 (c) META Platforms, Inc. 保留所有權利。”
2. 不得使用將 Llama用于改進任何其他大型語言模型,但LLaMA 2或其衍生作品除外。
3. META對月活7億用戶的授權做了保留。如果被許可人使用LLaMA 2開發的軟件產品月度活躍用戶超過7億人的,則被許可人應在此前的一個月向META申請代碼許可授權,META有權自行決定是否進行授權,在META授權之前,被授權人無權行使任何權利。
以上條款是否有效?當然有效。Llama 2的軟件著作權屬于META,公開源代碼時對權利進行保留,只要不違反法律規定,也是其合法權利。另外,筆者查了一下,OpenAI[iii] 用戶協議Claude[iv]用戶協議中均含有不得用其服務改進競爭對手產品的條款,但Google Bard[v] 和文心一言[vi]的用戶協議則沒有此類條款。
因為對授權進行了限制,所以雖然META公開了LLaMa 2的源代碼,但開源軟件機構Open Source并不認為這種做法屬于開源,他們還特地發了個文章[vii]做了個說明:因為開源許可證不應歧視個人、團體或工作領域。而META對 LLaMa 模型和代碼的許可時對月活超過7億用戶的開發者,以及用LLaMa改進其他大型語言模型做了授權限制,因此不符合開源標準。
二、零一萬物公司有什么法律責任
筆者查了下零一萬物公司的用戶協議[viii],其并未包含META對LLaMA 2軟件協議中的限制,其也沒有公示其大模型是使用LLaMA 2的代碼進行了改編(目前已做部分修改)。所以首先涉嫌侵犯署名權,這個前文已述。其次,LLaMA 2的軟件協議對被授權人授權的前提條件是要公示權利標識:“LLaMA 2已根據LLaMA 2社區許可證獲得許可,版權所有 (c) META Platforms,Inc. 保留所有權利。”
如果沒有公示的,可以視為被授權人沒有滿足授權條件,所以其二次開發及發布均涉嫌侵權,二次開發侵犯META公司的軟件修改權,發布修改后的源代碼及編譯后的目標程序,則侵犯META公司的軟件信息網絡傳播權。
同時,如果零一萬物公司不承認套殼的,也就不能算LLaMA 2的衍生作品,會同時違反“不得使用將 Llama用于改進任何其他大型語言模型,但LLaMA 2或其衍生作品除外”的用戶協議規定。
三、使用零一萬物代碼開發衍生作品者的法律風險
如果第三方開發者不了解情況,使用了零一萬物公司隱匿來源的代碼做再次開發的,同樣會因為受零一萬物公司的牽連,面臨侵權法律風險。定性上,零一萬物公司的法律風險,第三方開發者都有,只是如果不明知,侵權的性質就沒有那么嚴重。
對零一萬物公司侵權代碼再次開發(含三次開發、四次開發……)的作品代碼如果包含LLaMA 2代碼的,首先會侵犯META的署名權,其次是META公司的軟件修改權,發布修改后的源代碼及編譯后的目標程序,則侵犯了META公司的軟件信息網絡傳播權。
LLaMA英文對應的是一種可愛的動物——美洲大羊駝,也就是中國網民俗稱的“草泥馬”。中文俗稱雖然有點粗俗,但LLaMA的軟件協議雖然對使用有限制,但規定其實并不嚴厲,如果像筆者之前介紹的《用GitHub上的開源代碼訓練人工智能違法嗎?》[ix]一文中提到的,是用了GPL協議項下的代碼而不標識的,法律風險會更大。總之,我們對公開源代碼軟件的態度應該需要更加嚴謹,要用別人的代碼,就應該遵守別人的開源協議,否則,不但自己可能侵權,還會連累用你產品開發衍生產品的人。
本文作者:游云庭,上海大邦律師事務所高級合伙人,知識產權律師。本文僅代表作者觀點。
[i] https://www.sohu.com/na/737188391_161795
[ii] https://github.com/facebookresearch/llama/blob/main/LICENSE
[iii] https://openai.com/policies/business-terms
[iv] https://console.anthropic.com/legal/terms
[v] https://policies.google.com/terms/generative-ai/use-policy
[vi] https://wenxin.baidu.com/AIDP/wenxin/Yl6th25am
[vii] https://blog.opensource.org/Metas-llama-2-license-is-not-open-source/
[viii] https://huggingface.co/01-ai/Yi-6B/blob/main/LICENSE
[ix] https://mp.weixin.qq.com/s/1TTkYh2yJZgd_CSCbtdgkw
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.