本期介紹如何在看典古籍平臺通過古籍數字化功能完成古籍圖像上文字的識別提取。
一、進入圖像識別功能頁面
![]()
二、選擇要識別的圖像文件
在左側文件上傳區域拖入本地圖像文件或點擊在彈窗中選擇圖像文件
![]()
三、設置識別參數
文本排版方向:圖像中文字的排列方向,分為橫向和豎向,可選自動識別將自動判斷或者指定橫豎排模式;
識別版本選擇:識別算法的不同版本,不同版本識別結果會有差異;
識別模式選擇:可以指定用行檢測識別模式或字符檢測識別模式,字符模式下文本的順序可能會有錯誤的情況,兩種模式的區別如下:
行檢測識別模式:
![]()
字符檢測識別模式:
![]()
圖像尺寸調整:過大的圖像占用帶寬較多且對于識別結果差異不大,建議圖像尺寸在1000-2000,可以根據不同的圖像自主進行調整,為 0 時不調整圖像尺寸;
四、開始識別
點擊開始識別按鈕,識別引擎將提取并識別圖像上的文字內容,將識別結果寫入到識別結果中
![]()
點擊識別結果底部的功能按鈕可以執行相應的功能:
合并結果:將分句文本合并為一段
![]()
![]()
轉簡體:將繁體的文字轉為簡體文字
![]()
復制文字:點擊一鍵復制結果。
五、批量識別
在實際使用中,大部分用戶希望可以批量識別圖像文件,可以在古籍數字化平臺中使用多圖識別功能,具體操作如下:
進入多圖識別功能頁面:
![]()
和PDF識別功能的區別只有上傳文件的區別,可以上傳多張圖像進行處理,識別結果和PDF識別功能一致,可以參見PDF識別使用教程使用教程·古籍數字化·PDF文件識別。
以上就是看典古籍平臺上古籍數字化·圖像文件識別功能的使用教程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.