我們經(jīng)常看到好的文字,,又不能在短時(shí)間內(nèi)記錄下來(lái),,一般用掃描儀或照相機(jī)拍攝成圖片,那么怎么才能變?yōu)榭勺R(shí)別的文字呢,。
方法有二:
一,、用一些專業(yè)的orc識(shí)別軟件可以直接進(jìn)行圖片識(shí)別,如漢王,、尚書(shū)等,。這種最簡(jiǎn)單,不行的話再用下面的方法,。
二,、先現(xiàn)將圖片轉(zhuǎn)換為pdf文件,然后用pdf識(shí)別軟件識(shí)別,,打開(kāi)word編輯文字,。
(注意:拍攝的時(shí)候,照片里的文字和背景之間的區(qū)別要清晰,圖片內(nèi)容盡量保持整齊和完整,,不要有皺褶,,不然會(huì)影響后面的文字識(shí)別,另外,,如果用數(shù)碼相機(jī)拍取的話,,最好打開(kāi)閃光燈,保持紙質(zhì)文檔中文字區(qū)域的背景色一致,。)
第一步、圖片轉(zhuǎn)換為pdf:有五種方法
方法一,、用“JPG轉(zhuǎn)PDF轉(zhuǎn)換器”比較快,,非常簡(jiǎn)單。(http://www./Software/design/zhuanhuantuxiang/1365.html)
方法二,、用“圖片PDF轉(zhuǎn)換精靈pictopdf2006.”也比較快,,非常簡(jiǎn)單。
方法三,、用TinyPDF虛擬PDF打印機(jī)轉(zhuǎn)換:這里下載:(http://www./softwares/TinyPDF.zip),。安裝完成后,會(huì)在系統(tǒng)里安裝一臺(tái)虛擬打印機(jī),。然后選中圖片—打印—照片打印—下一步—選中圖片—下一步“打印選項(xiàng)”選,。TinyPDF—下一步另存為—pdf文件—完成。
方法四,、用PDF_Factory_Pro_v3.52(http://www./read.php?tid=694899),。安裝完成后,會(huì)在系統(tǒng)里安裝一臺(tái)虛擬打印機(jī),。然后選中圖片—打印—照片打印—下一步—選中圖片—下一步“打印選項(xiàng)”選PDF_Factory_Pro—下一步—彈出PDF_Factory_Pro窗口--另存為—pdf文件—完成,。
方法五:用Office 2003中自帶的MicrosoftOffice Document Imaging工具。安裝以后實(shí)際上在office工具里有兩個(gè)組件:“Microsoft Office Document Scanning”為掃描組件,、“Microsoft Office Document Imaging”為圖像組件,。
(一般的office2003中都帶。通過(guò)“開(kāi)始”---“程序”---“MicrosoftOffice”---“MicrosoftOffice工具”---看看有沒(méi)有,。如果沒(méi)有就到這里下載安裝:http://www.microsoft.com/downloads/info.aspx?na=90&p=&SrcDisplay&SrcCategoryId=&SrcFamilyId=dd172063-9517-41d8-82af-29c38f7437b6&u=http%3a%2f%2fdownload.microsoft.com%2fdownload%2fa%2fb%2fe%2fabe96e44-28a6-4743-b530-a689da658c88%2fCHSOCR.msi?,,安裝后會(huì)在在打印機(jī)列表里增加一個(gè)Microsoft OfficeDocument Image Writer虛擬打印機(jī)。
再不行的話需要完整版的office2003重新安裝一下,,到這里下載“蜻蜓特派員的空間”解壓密碼“dragonflylee”http://hi.baidu.com/dragonflylee/blog/item/d6418a1992dbe3a24bedbc75.html)
操作:選中圖片—打印—照片打印—下一步—選中圖片—下一步“打印選項(xiàng)”選,。Microsoft Office Document Image Writer—下一步另存為—Tag圖像TIF文件—完成。
第二步,、Pdf文件識(shí)別出文字:有2種方法
方法一:直接轉(zhuǎn)換識(shí)別:使用CAJViewer7.0軟件,。運(yùn)行軟件,文件---打開(kāi)—找到圖片pdf,。工具---選擇圖像---劃出要識(shí)別的部分,;工具---文字識(shí)別---保存,,
ok啦。本法簡(jiǎn)單快捷?。,。?/SPAN>
方法二|:用office Document Image Writer轉(zhuǎn)換識(shí)別,。
1,、先使用pdf閱讀器打開(kāi)待轉(zhuǎn)換的PDF文件,接下來(lái)選擇“文件→打印” →“打印機(jī)” →“名稱”欄選擇“Microsoft Office Document Image Writer” →確認(rèn)后→將該PDF文件“另存為”輸出為MDI或TIF格式的虛擬打印文件,。
2,、運(yùn)行Microsoft Office Document Imaging,點(diǎn)擊“文件”欄下面的打開(kāi)文件夾“圖標(biāo)”(不要點(diǎn)擊左上角的“文件”,,容易出錯(cuò)),,打開(kāi)前面保存的MDI或TIF文件,用鼠標(biāo)選擇你需要的文字內(nèi)容(被選中的內(nèi)容在紅色 的框內(nèi)),,點(diǎn)擊“工具”→“將文本發(fā)送到Word”,,在彈出的窗口中勾選“在輸出時(shí)保持圖片版式不變” →確認(rèn)→系統(tǒng)提示“必須在執(zhí)行此操作前重新運(yùn)行OCR。這可能需要一些時(shí)間”→確認(rèn)即可,。
3,、發(fā)送到 word 中后,我們就可以在 word 中對(duì)該文檔進(jìn)行編輯,、排版等操作了,。
另:據(jù)說(shuō)圖片文字轉(zhuǎn)文本最快的是一款叫賽酷OCR的工具,圖片,、PDF均可轉(zhuǎn)換成可編輯的文字,。自己找一下吧。