文書檔案數(shù)字化形成的電子文件數(shù)量巨大,,一般縣級檔案館文書檔案達(dá)幾百萬頁,將其數(shù)字化,,所需存儲空間很大,。選擇好檔案數(shù)字化副本存儲格式,既可減少存儲空間,,也可提高上傳,、下載速度,具有重要意義。 這是我們接觸最多的圖像格式,。手機(jī)拍攝下來的照片格式一般為JPG格式,。JPEG是 Joint PhotographicExperts Group的縮寫,直譯是“聯(lián)合圖像專家小組”,。也就是說,,該格式是由這個軟件開發(fā)小組制定的。這種圖像格式,,就是把圖像壓縮,,使圖像變得很小,所占存儲空間也就很小,。在網(wǎng)絡(luò)上易于傳輸,,一般網(wǎng)頁上的圖片都是這種格式。這種壓縮是損壞性壓縮,,把圖像中重復(fù)或不重要的信息去除,,容易造成圖像數(shù)據(jù)的損傷。JPEG格式優(yōu)點(diǎn)也多,,可用最少的磁盤空間得到較好的圖像品質(zhì),。 1.2 JPEG2000格式 JPEG2000是JPEG的升級版,其特點(diǎn):一是更高的壓縮率,,一般比JPEG高出30%左右,;二是支持無損壓縮;三是能實(shí)現(xiàn)漸進(jìn)傳輸,。在網(wǎng)上看一些圖片,,如網(wǎng)速較慢,往往先看到圖像的輪廓,,然后出現(xiàn)模糊圖像,,接著圖像會越來越清晰,這就是圖像漸進(jìn)式下載過程,。JPEG2000重要特性是支持漸進(jìn)傳輸,。 1.3 BMP格式 BMP圖像是微軟推出的圖像格式,在Windows操作系統(tǒng)中是作為標(biāo)準(zhǔn)圖像格式的,,Windows應(yīng)用程序一般都會支持BMP格式,。BMP是英文Bitmap的簡寫,應(yīng)用較廣泛,。與JPEG比,,它幾乎不進(jìn)行壓縮,。由于幾乎不進(jìn)行壓縮,,所以圖像信息非常豐富。它優(yōu)點(diǎn)突出,缺點(diǎn)也突出,。缺點(diǎn)即是太占地方,。 1.4 RAW 格式 數(shù)碼相機(jī)進(jìn)行圖像格式切換,常見的是JPEG格式同RAW格式的相互切換,。JPEG格式是一種壓縮格式,,而RAW格式則是幾乎未經(jīng)處理而直接從數(shù)碼相機(jī)或數(shù)碼攝像機(jī)生成的圖像。如果同一數(shù)碼相機(jī),,采用兩種格式拍攝,,再經(jīng)過圖像處理軟件進(jìn)行調(diào)整,比如調(diào)曝光度,、飽和度,、對比度等,則RAW格式會更生動,、更接近實(shí)際,;JPEG格式由于進(jìn)行了有損壓縮,后續(xù)很難進(jìn)行校正,,幾乎無調(diào)整余地,。 1.5 GIF格式 GIF格式是英文Graphics Interchange Format的縮寫,即為可交換圖形格式,,是作為一種公用標(biāo)準(zhǔn)而設(shè)計(jì)的,。主要用來解決跨平臺圖像格式問題。GIF可制作成透明圖像,、動畫等,,在網(wǎng)絡(luò)上大量使用。 1.6 PNG格式 PNG格式可以說是完全為網(wǎng)絡(luò)而生的圖像格式,,是替代無損壓縮的位圖格式,,如GIF格式。PNG具有可編輯性,,能制作成透明圖片,,是最近幾年才被大多數(shù)瀏覽器支持的圖像格式。盡管它的壓縮率較高,,但與JPEG比還是太大,。 1.7 TIFF格式 TIFF是英文Tag Image File Format的縮寫,意思是標(biāo)簽圖像文件格式,。TIFF,、JPEG和PNG都是較為流行的高位彩色圖像格式,主要用來存儲包括照片和藝術(shù)圖片在內(nèi)的圖像,??梢允嵌囗撐募?,即多個圖像組成一個TIFF文件。TIFF圖像文件格式有漏洞,,可受到遠(yuǎn)程攻擊或是被誘使打開惡意文檔,。 1.8 PDF格式 PDF是近幾年流行起來的圖像文件格式,是英文Portable Document Format的縮寫,,意為便攜式文檔格式,。如職稱申報系統(tǒng),幾乎所有圖像都需生成相應(yīng)的PDF文件,。這種格式可以最少的文件數(shù)量上傳,,也便于閱讀。 實(shí)驗(yàn)一:用攝像頭拍攝一張色彩單一封面,,分別采用JPEG,、PNG、BMP,、TIFF格式存儲,,大小如下表。 實(shí)驗(yàn)三:把拍攝換成掃描,生成灰度文檔,,分別采用JPEG,、PNG、BMP,、TIFF格式存儲,,大小如下表。 實(shí)驗(yàn)四:以彩色模式掃描同一文檔,分辨率相同,,分別采用JPEG,、PNG,、BMP、TIFF格式存儲,,其大小如下表,。 實(shí)驗(yàn)五:掃描多頁文件,,生成TIFF和PDF文檔,比較文檔大小,。掃描4頁文件,,彩色模式,如下表,。 (2) 生成的b.TIFF文件所占空間為a.PDF所占空間的7倍,。這個倍數(shù)并不是固定的,,但TIFF文件要比PDF文件大得多,至少2倍以上,。 我們具體應(yīng)依據(jù)什么確定文書檔案數(shù)字化圖像格式?!兑?guī)范》要求“數(shù)字圖像清晰,、完整、不失真,,圖像效果最接近檔案原貌,。為最大限度保留檔案原件信息,便于多種方式的利用,,宜全部采用彩色模式進(jìn)行掃描”。即掃描出的圖像盡可能接近實(shí)體,。掃描出的圖像我們可以無限接近實(shí)體,,但這些圖像必須保存下來,才能生成數(shù)字圖像,。JPEG格式,,是損壞性壓縮文件,壓縮率越高,,損壞越大,,只是我們?nèi)庋垭y以分辨,當(dāng)你想再次修正這種圖像時,,可修正的余地很少,,在更多細(xì)節(jié)上無法修正。但它的好處是存儲空間小,,傳輸速度快,。文書檔案數(shù)字化后,能滿足文字識別需要就可以了,,所以,,在300dpi下彩色掃描的數(shù)字檔案,采用JPEG格式保存較好,。TIFF格式與JPEG格式相比,,優(yōu)點(diǎn)是可將多頁圖像生成一份文檔,能保存豐富的圖像信息,。但它所占存儲空間是JPEG文件數(shù)倍,,所以我認(rèn)為重要的文書檔案,可采用這種格式,,一般文件不宜采用,。應(yīng)注意,PDF格式不是數(shù)字化圖像長期保存格式,。但從數(shù)字文件管理,、調(diào)用等方面看,,卻非常便捷,應(yīng)將PDF納入長期保存檔案基本格式,,而非僅僅作為應(yīng)用層次的轉(zhuǎn)化格式,。 |
|