在人工智能迅猛發(fā)展的當(dāng)下,大語(yǔ)言模型正逐步滲透到各個(gè)專(zhuān)業(yè)領(lǐng)域。然而,當(dāng)我們將目光聚焦于專(zhuān)利這一特殊行業(yè)時(shí),必須清醒地認(rèn)識(shí)到,僅僅依靠大語(yǔ)言模型本身,要達(dá)到理想的應(yīng)用效果,還有很長(zhǎng)的路要走。
![]()
專(zhuān)利行業(yè)具有高度的獨(dú)特性和復(fù)雜性。一方面,專(zhuān)利檢索要求極高的精準(zhǔn)度,任何細(xì)微的不匹配都可能導(dǎo)致重要專(zhuān)利被遺漏。另一方面,專(zhuān)利文獻(xiàn)包含大量高度細(xì)致和專(zhuān)業(yè)的場(chǎng)景描述,這些內(nèi)容在大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)中占比有限。
要知道,專(zhuān)利數(shù)據(jù)庫(kù)規(guī)模龐大,可達(dá)幾十至上百TB,但實(shí)際用于訓(xùn)練大語(yǔ)言模型的專(zhuān)利數(shù)據(jù)只是其中一小部分。這就意味著,模型對(duì)很多專(zhuān)業(yè)場(chǎng)景的理解存在天然局限性。
許多人對(duì)大語(yǔ)言模型抱有“輸入目標(biāo),自動(dòng)得到完美結(jié)果”的期望,這在專(zhuān)利領(lǐng)域尤其不現(xiàn)實(shí)。以專(zhuān)利撰寫(xiě)為例,直接要求模型“寫(xiě)一份關(guān)于某技術(shù)的權(quán)利要求書(shū)”,通常會(huì)得到格式正確但內(nèi)容空洞、保護(hù)范圍不合理的結(jié)果,這不僅無(wú)法滿(mǎn)足專(zhuān)業(yè)需求,甚至可能導(dǎo)致專(zhuān)利保護(hù)不力,事與愿違。
專(zhuān)利檢索是專(zhuān)利申請(qǐng)過(guò)程中的關(guān)鍵任務(wù),目的是尋找與現(xiàn)有專(zhuān)利相關(guān)的技術(shù)文獻(xiàn)。很多人誤認(rèn)為可以直接將檢索式交給大語(yǔ)言模型生成,期待它能提供準(zhǔn)確的檢索結(jié)果。然而,大語(yǔ)言模型的輸出往往依賴(lài)于其訓(xùn)練數(shù)據(jù)的范圍和質(zhì)量,而專(zhuān)利數(shù)據(jù)庫(kù)內(nèi)容龐大且結(jié)構(gòu)化。大語(yǔ)言模型雖然可以生成一些常見(jiàn)的檢索式,但它無(wú)法準(zhǔn)確地從海量的專(zhuān)利中篩選出相關(guān)性較高的專(zhuān)利。因?yàn)樗鼪](méi)有直接連接到專(zhuān)利數(shù)據(jù)庫(kù),不能基于最新的專(zhuān)利數(shù)據(jù)進(jìn)行深度檢索,也無(wú)法處理專(zhuān)利中的技術(shù)細(xì)節(jié)和法律術(shù)語(yǔ)。所以,直接依賴(lài)模型生成檢索式,往往會(huì)導(dǎo)致檢索結(jié)果的相關(guān)性不足,影響后續(xù)分析的質(zhì)量。
專(zhuān)利的權(quán)利要求書(shū)是專(zhuān)利申請(qǐng)中至關(guān)重要的一部分,它定義了發(fā)明的保護(hù)范圍。撰寫(xiě)權(quán)利要求書(shū)不僅需要對(duì)技術(shù)細(xì)節(jié)有深入的了解,還需要遵循嚴(yán)格的法律和格式要求。大語(yǔ)言模型在生成權(quán)利要求時(shí),可以根據(jù)輸入的背景信息和技術(shù)方向生成文本,但這些生成的內(nèi)容常常缺乏法律精確性,可能存在描述不清、定義模糊的問(wèn)題。例如,如果沒(méi)有提供足夠的技術(shù)背景、發(fā)明目標(biāo)以及相關(guān)領(lǐng)域的詳細(xì)信息,大語(yǔ)言模型生成的權(quán)利要求可能會(huì)過(guò)于籠統(tǒng)或過(guò)于詳細(xì),導(dǎo)致無(wú)法準(zhǔn)確保護(hù)發(fā)明的獨(dú)特性。
專(zhuān)利實(shí)施例是專(zhuān)利申請(qǐng)中的技術(shù)實(shí)現(xiàn)部分,它詳細(xì)描述了如何實(shí)現(xiàn)發(fā)明的具體步驟和方法。在這方面,大語(yǔ)言模型的表現(xiàn)同樣有限。專(zhuān)利實(shí)施例通常涉及大量的技術(shù)細(xì)節(jié)和具體的操作步驟,依賴(lài)于發(fā)明人對(duì)技術(shù)的深刻理解以及行業(yè)經(jīng)驗(yàn)。大語(yǔ)言模型雖然可以根據(jù)給定的描述生成實(shí)施例的初步文本,但往往不能在技術(shù)層面提供高質(zhì)量的細(xì)節(jié)。因此,依賴(lài)大語(yǔ)言模型生成的實(shí)施例文本,需要經(jīng)過(guò)專(zhuān)家的審核和修改,才能達(dá)到實(shí)際應(yīng)用的標(biāo)準(zhǔn)。
大語(yǔ)言模型是概率模型,并非知識(shí)數(shù)據(jù)庫(kù):大語(yǔ)言模型 回答本質(zhì)上是基于統(tǒng)計(jì)預(yù)測(cè)下一個(gè)最可能的詞語(yǔ),它并沒(méi)有實(shí)時(shí)訪問(wèn)權(quán)威知識(shí)庫(kù),生成內(nèi)容靠的是訓(xùn)練語(yǔ)料中學(xué)到的模式。這意味著它有時(shí)會(huì)給出貌似合理但實(shí)際錯(cuò)誤的信息,所謂 “AI 幻覺(jué) ” 正來(lái)源于此。因此,大語(yǔ)言模型 提供的專(zhuān)利信息未必真實(shí)準(zhǔn)確,尤其當(dāng)涉及它未見(jiàn)過(guò)的新發(fā)明或最新專(zhuān)利時(shí)。
大模型覆蓋的專(zhuān)利數(shù)據(jù)不完整、更新不及時(shí):專(zhuān)利檢索和分析依賴(lài)于各國(guó)專(zhuān)利局的權(quán)威數(shù)據(jù)庫(kù),而大多數(shù)通用大模型的訓(xùn)練語(yǔ)料并不包含這些封閉數(shù)據(jù)源的全部?jī)?nèi)容。大模型并不像專(zhuān)業(yè)檢索引擎那樣擁有完整、最新的專(zhuān)利文獻(xiàn)庫(kù)作為支撐。
專(zhuān)利文本高度專(zhuān)業(yè)化,結(jié)構(gòu)嚴(yán)謹(jǐn),容錯(cuò)率極低:撰寫(xiě)專(zhuān)利文件是一項(xiàng)精細(xì)的工作,術(shù)語(yǔ)選擇需要準(zhǔn)確規(guī)范,權(quán)利要求范圍一字之差可能天差地別,邏輯結(jié)構(gòu)要嚴(yán)密自洽。這些都是目前的大模型難以完全勝任的。模型生成的文字往往追求語(yǔ)義通順,但在法律嚴(yán)謹(jǐn)性上有所欠缺。
要在專(zhuān)利行業(yè)充分發(fā)揮大語(yǔ)言模型的價(jià)值,我們需要進(jìn)行一些設(shè)計(jì),例如:
提供充分的上下文信息,巧設(shè)提示,使用大語(yǔ)言模型前,務(wù)必先向其 “ 喂料 ” 。模型輸出質(zhì)量高度依賴(lài)輸入提示( Prompt )的質(zhì)量。盡可能詳細(xì)地提供技術(shù)背景、發(fā)明要解決的痛點(diǎn)、核心技術(shù)方案和目標(biāo)等信息,讓模型明白你要它扮演的角色和任務(wù)。
善用多輪對(duì)話(huà),逐步細(xì)化要求,不要指望模型一次回答就完美無(wú)缺。將復(fù)雜任務(wù)拆解,通過(guò)多輪交互引導(dǎo)模型優(yōu)化結(jié)果。比如,先讓模型給出幾個(gè)備選方案,然后人眼篩選出較好的版本,再要求模型基于此版本進(jìn)一步修改或完善。對(duì)于權(quán)利要求的撰寫(xiě),可以讓模型先生成獨(dú)立權(quán)利要求,再根據(jù)需要提示它 “ 增加某某技術(shù)特征 ” 或 “ 換一種更廣泛的表述方式 ” ,經(jīng)過(guò)幾輪調(diào)整,往往能得到更符合預(yù)期的草案。
將大模型嵌入特定專(zhuān)利工具和流程:企業(yè)和服務(wù)機(jī)構(gòu)可以開(kāi)發(fā)更定制化的 AI 工具,將通用大模型與專(zhuān)利領(lǐng)域?qū)I(yè)系統(tǒng)結(jié)合,打造 “ 人 + AI” 的高效工作流。例如:研發(fā)專(zhuān)利撰寫(xiě)輔助軟件,由模型根據(jù)發(fā)明交底書(shū)自動(dòng)生成說(shuō)明書(shū)初稿和部分實(shí)例,然后由代理人校對(duì)修改,節(jié)省撰寫(xiě)時(shí)間;利用模型的文本分類(lèi)能力,對(duì)海量專(zhuān)利文獻(xiàn)進(jìn)行初步分類(lèi)、篩選,在情報(bào)分析時(shí)快速鎖定相關(guān)領(lǐng)域文獻(xiàn);又或者讓模型根據(jù)輸入的技術(shù)方案,提供一個(gè)可專(zhuān)利性初步判斷,列出該方案可能涉及的現(xiàn)有技術(shù)要點(diǎn),供代理人參考。
假設(shè)我們要讓大語(yǔ)言模型寫(xiě)權(quán)利要求,不是把交底書(shū)直接輸入到大語(yǔ)言模型中,讓直接讓其生成最終的權(quán)利要求,以目前的大語(yǔ)言模型的能力,不可能達(dá)到想要的效果,因?yàn)楝F(xiàn)在的大語(yǔ)言模型還不是AGI,訓(xùn)練的時(shí)候語(yǔ)料有限,最終的能力與數(shù)據(jù)質(zhì)量、數(shù)量處理方式、訓(xùn)練方式密切相關(guān),專(zhuān)利相關(guān)的數(shù)據(jù)多大幾百T的容量,光文本部分多大十幾T,目前任何的大語(yǔ)言模型的訓(xùn)練也只能抽取其中的一小部分,根本不可能達(dá)到很多人想象的那種輸入質(zhì)量,直接得到理想效果的程度。
例如我們假設(shè)讓大語(yǔ)言模型修改權(quán)利要求,假設(shè)輸入一段技術(shù)資料給大語(yǔ)言模型,第一版的權(quán)利要求是原始的權(quán)利要求,筆者通過(guò)兩輪迭代就可以讓權(quán)利要求變成第三版本,大家看下效果如何,這是完全依靠大語(yǔ)言模型生成,筆者未修改任何一個(gè)字。倘若讓大語(yǔ)言模型直接在原始的權(quán)利要求基礎(chǔ)上直接修改,是不可能得到完善的結(jié)果的。
原始權(quán)利要求:一種雙層反轉(zhuǎn)刀片無(wú)渣豆?jié){機(jī),包括機(jī)頭(1)、桶體(2)、電機(jī)(3)、電機(jī)軸(4)、下刀片(5)、加熱元件(6)、防溢傳感器(7)和溫度傳感器(8),所述機(jī)頭(1)與桶體(2)相配合,所述電機(jī)(3)安裝在機(jī)頭(1)中,所述電機(jī)軸(4)一端與電機(jī)(3)相連,另一端與所述下刀片(5)相連,所述下刀片(5)伸入桶體(2)內(nèi),所述加熱元件(6)、防溢傳感器(7)和溫度傳感器(8)的一端安裝在機(jī)頭(1)上,另一端伸入桶體(2)內(nèi);其特征在于:所述電機(jī)軸(4)上套設(shè)有一軸套(9),所述軸套(9)通過(guò)軸承與所述電機(jī)軸(4)轉(zhuǎn)動(dòng)連接,并裝有上刀片(10),使得所述上刀片(10)能夠相對(duì)于所述下刀片(5)反向旋轉(zhuǎn)。
第一輪迭代:一種豆?jié){機(jī),包括桶體(2)、電機(jī)(3)、電機(jī)軸(4)和位于所述桶體(2)內(nèi)的下刀片(5),所述電機(jī)(3)通過(guò)所述電機(jī)軸(4)帶動(dòng)所述下刀片(5)旋轉(zhuǎn);其特征在于:所述電機(jī)軸(4)上可旋轉(zhuǎn)地安裝有上刀片(10),所述上刀片(10)設(shè)置成相對(duì)于所述下刀片(5)反向旋轉(zhuǎn)。
第二輪迭代:一種豆?jié){機(jī),包括容器(2)和驅(qū)動(dòng)裝置(3),所述驅(qū)動(dòng)裝置(3)具有驅(qū)動(dòng)軸(4),所述驅(qū)動(dòng)軸(4)伸入所述容器(2)內(nèi),其末端連接第一刀片(5);其特征在于:所述驅(qū)動(dòng)軸(4)上可旋轉(zhuǎn)地安裝有第二刀片(10),所述第一刀片(5)和第二刀片(10)分別設(shè)置成反向旋轉(zhuǎn)。
只要掌握大語(yǔ)言模型的原理,知道模型的界面和擅長(zhǎng)的能力,通過(guò)對(duì)業(yè)務(wù)場(chǎng)景的拆解,大語(yǔ)言模型會(huì)高效出色地協(xié)助我們完成工具。通俗地說(shuō),現(xiàn)在的大語(yǔ)言模型更像是機(jī)器上的電動(dòng)機(jī),只能做簡(jiǎn)單粗暴的工作,這是由大語(yǔ)言模型的本質(zhì)決定,因?yàn)橐瓿上鄳?yīng)的工作,就需要做工作流的拆解和流程的設(shè)計(jì),讓大語(yǔ)言模型分階段去執(zhí)行,結(jié)合人工去選擇。這也是Maxipat的理念。很多朋友經(jīng)常說(shuō)為什么Maxipat設(shè)計(jì)的流程那么復(fù)雜,為什么不能直接都一鍵完成,實(shí)際上一鍵完成恰恰是最簡(jiǎn)單的,因?yàn)橹灰斎胩崾驹~就可以,但這樣沒(méi)有多少實(shí)際意義,任何人都可以在通用的大語(yǔ)言模型上這樣操作。
不同的人使用大語(yǔ)言模型產(chǎn)生的結(jié)果天壤之別,關(guān)鍵就在于對(duì)于模型的本質(zhì)和業(yè)務(wù)場(chǎng)景的理解。要理解大模型作為任何行業(yè)的“電動(dòng)機(jī)”能夠在特定的行業(yè)可以做什么?能力的邊界在哪里?模型本身的缺陷導(dǎo)致的沖突在哪里?行業(yè)的痛點(diǎn)在哪里?業(yè)務(wù)的流程如何拆解到模型能力勝任的地方。
大語(yǔ)言模型的出現(xiàn),為專(zhuān)利行業(yè)帶來(lái)了前所未有的效率提升機(jī)會(huì)。它可以快速生成文本、分析語(yǔ)言模式,完成一些初步工作,從而解放專(zhuān)利人的部分精力。然而,大語(yǔ)言模型并不是全知全能的智囊,它有算法和訓(xùn)練數(shù)據(jù)的先天局限。只有深刻理解這些本質(zhì)和限制,我們才能避免把AI當(dāng)成“神筆馬良”而用錯(cuò)場(chǎng)景。
正確的做法是以人為主導(dǎo),結(jié)合AI助手。人類(lèi)專(zhuān)家擅長(zhǎng)判斷、創(chuàng)造和決策,AI擅長(zhǎng)速度和海量數(shù)據(jù)處理,兩者優(yōu)勢(shì)互補(bǔ),才能在專(zhuān)利工作中達(dá)到1 + 1 > 2的效果。相反,如果對(duì)AI寄予不切實(shí)際的期望,忽視必要的核查和平衡,最終可能會(huì)事與愿違,甚至造成嚴(yán)重失誤。
總而言之,大模型就像一把功能強(qiáng)大的新工具,掌握用法者收益無(wú)窮;但若盲目使用,這把“雙刃劍”也可能傷及自身,讓“人 + AI”的協(xié)作模式才能真正提高專(zhuān)利工作的質(zhì)量和效率。
Maxipat致力于作為成為科技創(chuàng)新和知識(shí)產(chǎn)權(quán)工作的AI加速器,主要包括輔助創(chuàng)新:提高研發(fā)的科技創(chuàng)新效率;智能搜索與分析:將專(zhuān)利搜索和報(bào)告制作借助AI實(shí)現(xiàn)智能化,包括智能查新、無(wú)效、FTO、Landscaping報(bào)告;投資助手:快速生成投資賽道報(bào)告、專(zhuān)利購(gòu)買(mǎi)篩選、專(zhuān)利轉(zhuǎn)化評(píng)估。目前開(kāi)放注冊(cè)中。輔助科技創(chuàng)新和知識(shí)產(chǎn)權(quán)工作的AI智能體
感興趣的朋友可以通過(guò)以下三種方式填寫(xiě)申請(qǐng)信息:
1. 請(qǐng)發(fā)郵件到郵箱:info@maxipat.com
2. 點(diǎn)擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.