在專利分析中,對數據進行標引和分類一直是一個令人頭疼的問題。例如,技術人員需要定期查看競爭對手公布的專利,以了解行業的動態,而知識產權人員則需要時刻關注競爭對手的專利布局。對于相關的技術領域,每個月公布的專利數量可能多達成千上萬件,要系統地研究這些專利,就必須對它們進行分類和標引。
例如,一項電池專利可以被標引為幾個層級,如動力電池/正極材料/磷酸鐵鋰等。對于成千上萬件專利進行多層級的標引和分類,工作量極大。
如果通過設置檢索式篩選或向量標引來解決這個問題,雖然可以減輕部分工作量,但準確度往往較差,無法滿足要求。
在大語言模型出現之后,業內許多人嘗試利用這些模型進行標引。例如,將一個專利表格和標引的標簽提供給模型,讓模型進行標引,但結果往往不盡如人意,相信很多朋友也嘗試過,發現難以滿足要求。
此外,傳統的AI標引還需要人工先標引一部分數據,然后用這一部分作為監督數據進行匹配,這也是一件不容易的事情。對于標引維度和層級較多的項目,要將所有層級的專利都標引清楚,并確保準確度,既費時又費力。
此外,傳統的AI標引無法定義標引的維度,因為每個用戶對特定維度都有自己的定義。例如,“引流部”這個標簽作為一個標引層次,每個用戶在特定背景下對其定義都不同,僅憑幾個示例數據是無法確定這個標簽的含義的。
Maxipat采用了一種完全不同的標引模式。用戶想要標引一部分數據時,不需要進行精確檢索,只需大概檢索出一個大范圍的專利,保存在文件夾中。然后直接輸入需要標引的維度,或者從文件中導入需要標引的標簽。對于一些容易混淆的標簽,用戶可以提供一些解釋和定義,系統會自動掃描文件進行逐一標引。
![]()
這種方式完全是基于自然語言輸入,用戶想標引什么內容,只需直接輸入到系統中即可,無需擔心各種格式問題。
標引完成后,系統會對每一處標引給出明確的理由,用戶也可以通過指令進行糾正。
假設用戶需要標引10000項專利,只需通過自然語言輸入要標引的維度,或者上傳要標引的維度,并告知系統需要注意的事項,大約兩個小時后就可以查看標引結果。
![]()
如果用戶對標引結果不滿意,可以直接通過自然語言指令進行糾正,快速改善標引結果。
采用這種方法,標引10000項專利,假設使用自然語言糾正迭代三次,半天就能完成,而且不需要對數據進行清理,系統會根據用戶的指令識別噪聲。這將大大提高標引的效率和質量。
Maxipat致力于作為成為科技創新和知識產權工作的AI加速,主要包括輔助創新:提高研發的科技創新效率,通過problem-solution算法深層關聯到的真實技術方案,能夠跨領域進行技術方案的深層挖掘和關聯;智能搜索與分析:將專利搜索和報告制作借助AI實現智能化,包括智能查新、無效、FTO、Landscaping報告,采用GT搜索算法(graph transformer)(),系統真正做到理解概念后再搜索。目前開放注冊中。
感興趣的朋友可以通過以下三種方式填寫申請信息:
1. 請發郵件到郵箱:info@maxipat.com
2. 點擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.