對專利數據進行分類和標引是專利工作的重要組成部分。在進行專利信息分析的過程中,不管是專利導航、專利地圖、專利全景分析等,對專利數據進行分類和標引是基礎工作,常常占專利分析工作的一半以上的時間。比如我們要了解下自動駕駛這個領域的專利,那就需要對自動駕駛這個領域的專利數據進行分類標引,給每個專利打上標簽。例如分成感測、導航、高精度地圖、決策,規劃,其中高精度地圖有可能分成點云地圖、靜態高精度地圖、動態高精度地圖,每個技術點有時候需要分成好幾個層次。
在很多專利分析項目中,分析人員需要專利打上多個技術層級以及效果標簽等,在專利分析中,對一項專利打上三四個層級標簽和效果標簽是很常見的。
但是對專利分類標引或打標簽真是費時費力的事情,一個專利分析項目,需要標引的專利動輒成千上萬,打標簽相當于分析人員要去閱讀每一份專利,對于打多個標簽的情況下,不僅去讀專利的摘要,有時候還要看專利的說明書和權利要求才能確定,對于大型的專利分析項目,有時標引時間就要花幾個月。
如果標引分類工作變得簡單準確,專利的應用范圍會擴大很多。企業可以對自己感興趣的領域的專利進行實時標引,讓技術人員和IP人員隨時查看,促進企業的創新和專利布局。
當AI一出現的時候,知識產權界就希望通過AI解決專利標引的問題。最初的技術路線是通過向量標引,比如需要標引1000項專利,先人工標引100項,剩下的900項與已經標引過的100項進行向量匹配,根據向量匹配的程度進行標引。這種標引方式理論上是用戶標引的越多,剩余的部分越少,標引就越準確。但這種標引方式的缺陷是非常明顯的,本質上這種標引相當于做了多次語義搜索,標引的準確度完全依賴embedding的優劣,最大的缺陷是標引的精度取決于數據本身的技術領域分布情況,假設標引的1000項專利中分布有藥品、汽車、小家電,用這種方式標引效果較好,因為數據相互之間的差距大,很容易區分。
Maxipat基礎版的標引就是采用這種方式,比如筆者標引一份量子糾錯的專利,一共422項專利,用戶標引20項-40項,剩余300多項專利都用AI標引。但是這種標引的缺點也是很明顯的:
首先、標引的準確率取決于數據本身的技術領域分布程度,如果分布得很廣,比如1000項數據中有藥品、汽車、小家電,就會標引得準確。如果1000項專利中數據全部是量子糾錯,要在量子糾錯中再細分,對于這樣的標引任務,這種標引方式缺陷就出來了。
其次,在標引之前,人工先要標引一定量的數據,一般要標引20%左右,這對于很多大型的標引項目,這樣的標引數據量也是很費時費力的。
第三、一旦發現標引錯誤,糾正非常麻煩,糾正了一部分錯誤,很可能導致另一部分錯誤,而且糾錯只能繼續標引具體數據,無法通過指令操作。
Maxipat的AI深度標引系統完全改變過去的標引模式。采用新的標引系統后,標引完全在用戶可控的基礎上實現。
我們以一個很小的案例來看Maxipat深度標引系統的強大。假設我們要標引下一個自動駕駛的數據包,這個數據包括506項專利。用戶需要將這些數據標引為感測、高精度地圖、導航、決策、規劃,其中感測分為攝像頭感測、激光雷達感測。這時候用戶需要做的很簡單,只需要把這個指令輸入到Maxipat的標引系統中,如下所示:
![]()
Maxipat的標引系統會自動將標引輸入分成若干層級:
![]()
用戶根據自己的理解,對相應層級進行適當的解釋,也可以不解釋,系統就會進行第一次標引。
![]()
在系統進行第一次標引之后,用戶可以進行確認,確認之后刷新一次,相當于帶著人工監督的數據進行標引。
假如在系統標引之后,用戶發現還有需要糾正的,直接啟動自然語言糾正程序,讓Maxipat修改。比如有的數據既涉及到規劃也涉及到決策,用戶通過指令要求系統將所有標引為規劃的這部分數據修改為決策。系統得到指令后會自動對已經標引的數據進行糾正。
![]()
Maxipat的標引系統克服傳統AI標引的幾大缺陷,能夠在用戶可控的基礎上實現大規模的專利數據標引,而且根據用戶的指令隨時調整。
當用戶需要對大規模專利數據進行分類標引,按照技術領域進行預警時,只要啟動Maxipat的AI標引系統,可以輕松可控地實現,最大限度節約用戶的時間和成本。
Maxipat致力于作為成為科技創新和知識產權工作的AI加速,主要包括輔助創新:提高研發的科技創新效率,通過problem-solution算法深層關聯到的真實技術方案,能夠跨領域進行技術方案的深層挖掘和關聯;智能搜索與分析:將專利搜索和報告制作借助AI實現智能化,包括智能查新、無效、FTO、Landscaping報告,采用GT搜索算法(graph transformer)(),系統真正做到理解概念后再搜索。目前開放注冊中。
感興趣的朋友可以通過以下三種方式填寫申請信息:
1. 請發郵件到郵箱:info@maxipat.com
2. 點擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.