IT之家5月17日消息,繼上線語(yǔ)音速記功能后,,網(wǎng)易旗下產(chǎn)品有道云筆記又上線了另一實(shí)用的功能——文檔OCR(即文字識(shí)別),。據(jù)悉,,新上線的OCR功能在原有的掃描功能進(jìn)行了升級(jí),能夠幫助用戶輕松識(shí)別圖片,、PDF等掃描文檔中的文字,,并將其轉(zhuǎn)化成可編輯的文檔。 如果你還不了解新功能OCR究竟能為你做什么,,那你一定遇到過(guò)以下這些情況,,而OCR功能就是對(duì)這些“癥結(jié)”的那款“靈丹妙藥”: · 工作或者科研學(xué)習(xí)中,要應(yīng)對(duì)大量的紙質(zhì)文件,、書刊雜志,、PDF格式的電子資料,很難對(duì)這些格式的資料進(jìn)行編輯和整理 · 讀書時(shí),,看到不錯(cuò)的文章段落想要做書摘筆記,,但又懶得去打字或是手抄整理 · 在微信、微博等內(nèi)容平臺(tái)看到有價(jià)值的圖片內(nèi)容會(huì)隨手保存mark,,或是用截屏把手機(jī)頁(yè)面內(nèi)容保存到相冊(cè),,但這些圖片信息散亂在手機(jī)各處,很難進(jìn)行歸納,、整理和檢索 以上難題,,只需要5秒就能搞定! 那么,,如何用OCR識(shí)別功能將紙質(zhì)資料,、圖片和PDF文件,轉(zhuǎn)換為可以自由編輯的文本格式呢,? 「紙質(zhì)文檔」OCR識(shí)別 把紙書,、合同等紙質(zhì)文件、甚至墻體海報(bào),,轉(zhuǎn)換成可編輯的文本格式,,只需三步: step1:智能掃描 將有道云筆記升級(jí)為最新版后,點(diǎn)擊加號(hào)按鈕,,新建一篇“文檔掃描”,。 接下來(lái)就是見證實(shí)力的時(shí)刻,掃描過(guò)程中無(wú)需任何人工操作,,軟件可以自動(dòng),、精準(zhǔn)識(shí)別掃描圖像的邊框,去除掃描區(qū)域以外的多余背景,,并且矯正偏斜,,穩(wěn)!準(zhǔn),!狠,!地將資料掃描進(jìn)來(lái),。 如果對(duì)自動(dòng)掃描結(jié)果不夠滿意,還可以選擇手動(dòng)調(diào)節(jié)模式進(jìn)行微調(diào),。 在掃描過(guò)程中,,請(qǐng)盡量將文字?jǐn)[正,盡量剔除圖片中無(wú)關(guān)的部分,,這樣可以大大提高文字識(shí)別的準(zhǔn)確度啊~ step2:掃描圖片濾鏡美化 掃描后的圖片會(huì)自動(dòng)調(diào)節(jié)亮度和對(duì)比度,,可以便捷的設(shè)置為增強(qiáng)或黑白模式,讓圖片更清晰,。 step3:OCR識(shí)別,,提取圖片內(nèi)文字 在進(jìn)行OCR之前,請(qǐng)先將掃描文檔進(jìn)行同步保存,。選擇需要進(jìn)行文字識(shí)別的圖片后,,點(diǎn)擊底部的“識(shí)別”按鈕,就能將這張掃描圖片內(nèi)的文字識(shí)別出來(lái)并轉(zhuǎn)換成一篇文字筆記,。 識(shí)別出的文本會(huì)直接保存到有道云筆記內(nèi),,多平臺(tái)同步,你可以在手機(jī)版,、PC端,、網(wǎng)頁(yè)端等任意平臺(tái)的有道云筆記內(nèi)進(jìn)行修改、編輯,、整理,。 在掃描圖片足夠清晰的情況下,文本識(shí)別的準(zhǔn)確率可以達(dá)到95%以上,。 原圖片 識(shí)別文字 「圖片」OCR識(shí)別 如何將那些“鎖在”圖片里的文字提取出來(lái),?我們用一張hin長(zhǎng)(包含了2000多字內(nèi)容)的微博長(zhǎng)圖來(lái)為大家演示圖片OCR的用法和文字識(shí)別效果。 首先,,進(jìn)入有道云筆記,,選擇“上傳圖片”,將要識(shí)別處理的圖片同步保存到有道云筆記,。 然后,,在頁(yè)面底部找到“更多”按鈕,點(diǎn)擊“文本識(shí)別OCR”,,就可以看到長(zhǎng)圖內(nèi)的文字被完美識(shí)別出來(lái)了,! 雖然網(wǎng)絡(luò)圖片的分辨率不是很高,并且單張圖片文字內(nèi)容較多,,但是文字識(shí)別效果一點(diǎn)不含糊,。 圖片 ←→ 識(shí)別文本 「PDF文檔」OCR識(shí)別 除掃描文檔、圖片外,,有道云筆記(限會(huì)員)還可以PDF文本識(shí)別服務(wù),,PDF輕松轉(zhuǎn)Word! 將PDF文檔上傳到有道云筆記,,并完成同步后,,點(diǎn)擊底部的“OCR”按鈕,經(jīng)過(guò)幾秒的等待后(視PDF文檔大小而定),,就可以看到PDF內(nèi)的文字被識(shí)別出來(lái),,輕松轉(zhuǎn)化為可以自由編輯的筆記格式。 PDF文檔 識(shí)別文本 目前雙欄布局PDF文檔的文本識(shí)別支持度較差,,暫時(shí)建議選擇一欄布局的PDF文檔進(jìn)行OCR識(shí)別,。 另外,你還可以通過(guò)有道云筆記微信公眾號(hào)使用圖片OCR功能,!只要在微信對(duì)話框內(nèi)把圖片發(fā)給云筆記,,就能為你將圖片識(shí)別成文字。就像這樣↓ 想看到更多這類內(nèi)容,?去APP商店搜IT之家,,天天都有小歡喜。 |
|
來(lái)自: 蘇睿思 > 《OCR文字識(shí)別》