在一些公司和企業(yè)中,特別是檔案管理行業(yè),,經(jīng)常會遇到將大批的掃描件轉換成可以復制和檢索的雙層PDF或者是word文本的情況,!下面就簡單介紹一下: 首先這個過程是指,將紙質文件通過掃描儀快速掃描成圖片后,,經(jīng)過OCR識別,,然后可以直接生成可以檢索的雙層PDF文件。雙層PDF文件是指文件內容既包含文本層,,也包含圖像層,,且其位置上下一一相對應,這樣,,既可以100%保留原始版面效果(包括公章,、簽名),又可以通過下層的文字信息支持選擇,、復制,、全文檢索等功能。因此,,雙層PDF同時兼顧視覺效果和檢索方便性,,極大地方便了電子文件的管理,提高用戶對文檔的查詢和利用,。 這個將文件或圖片轉換成雙層的PDF的過程,,就需要一個必不可少的條件又或者說是技術——OCR文字識別! 首先我們需要一臺掃描儀(平板或者高掃)需要將紙質的文件掃描成圖片,! 然后打開“快檔通”O(jiān)CR文字識別軟件 在軟件的左上角有個圖像采集的按鈕,,這時我們可以選擇導入或者掃描,!導入的意思就是導入電腦上早已經(jīng)掃描完的圖片,掃描呢就是將手頭上的紙質文件通過掃描儀掃描后再識別,! 點擊識別之后,識別出了結果,,然后選擇導出雙層PDF就可以了,,而且識別率可以高達98%以上! 下面就是識別導出后的雙層PDF文件,! 而且這個軟件可以識別多種語言! 這款軟件又分為標準版和普通版,!標準版是針對普通用戶的,不需要開發(fā)集成,,買去可以直接使用的,!而普通版是針對有集成能力的集成商的,軟件需要開發(fā)集成才能用,! |
|