說明:本文是應依荷聽雨的要求,,為readfree《書園》網(wǎng)刊第3期寫的,。 ================================================== 我看電子書的時間應該算比較早,從DOS時代就開始了,。那個時候掃描儀還是貴族享受,,OCR也尚未普及,因此書的來源基本上是手敲(key in),。只不過有的網(wǎng)站敲的是名著,,如早期的太陽升、新語絲等,;有的敲的是網(wǎng)友自己的原創(chuàng)作品,,不過這個似乎色文更流行。格式多半都是TXT,。 在那個極度饑渴的時代,,我最開始的想法是:“哪兒有更多的書?”,,等到搜集到一定量后,,才開始考慮:“怎樣才能閱讀得更方便一點?”,。最原始的閱讀方式可能是DOS下的type|more命令,,后來發(fā)展到用EDIT、CCED等編輯器閱讀,。但是這些東西都要依賴中文DOS環(huán)境,,畢竟有所不便,而且總是單調(diào)的文本,,有時候也會覺得不過癮,,因此發(fā)展出一些與后來的打包電子書類似的東西。我曾經(jīng)在52ebook論壇上作為史料發(fā)過國內(nèi)EXE電子書先驅(qū)——VTTE(Visual Text To EXE Converter)的例子,,VTTE自帶中文字庫和中文顯示模塊,,可以在英文DOS下完美顯示中文(類似PDF的內(nèi)嵌字體),并且支持圖文混排,、超鏈接,、背景音樂等,與后來的EXE電子書相比也差不了多少,。 由于key in的錯誤率很低,,因此當時包括我在內(nèi),似乎都沒感覺到文字上的錯誤對閱讀造成什么障礙,,也很少有人提出校對的要求,,都是能看就行了。 大概從Windows 95時代開始,,掃描儀和OCR開始普及,,導致網(wǎng)絡上電子書出現(xiàn)了爆炸式增長。記得當時網(wǎng)絡上幾個主要做OCR書的網(wǎng)站,,采取的都是分工合作的流水線式操作:掃瞄,、OCR、校對都由不同的網(wǎng)友完成,,大家都是無償奉獻,、成果共享。最終TXT出來后,,掃瞄的圖像文件就被刪除了——沒辦法,,在那個年代,硬盤,,尤其是服務器專用硬盤實在是太貴了,。 由于OCR軟件自身的原因,和校對水平的不同,,導致當時網(wǎng)上某些文本錯誤較多,,所以我都用Word來讀書,邊看邊校對,。剛開始的時候,,一些文本整理工作也用Word來做,包括文件合并,、段落合并等,,后來發(fā)現(xiàn)Word干這些實在是太吃力,才做了TextForever(最開始的時候叫FineReader,,因為與國外某軟件重名,,后來才改成這個名字),。 進入本世紀后,隨著網(wǎng)絡泡沫的急劇膨脹,,所有人都在絞盡腦汁尋找吸引眼球的方法,,電子書這種低成本、高吸引力的好東東,,當然不會被所謂“聰明得腦門發(fā)亮”的IT人所放過,。為了適應網(wǎng)站下載需要,同時便于添加LOGO,、廣告等,,以及“防止資源被他人剽竊”,各種打包電子書開始大行其道,,從最原始的HLP,,逐漸發(fā)展到CHM、EXE,、SWF,、PDF等。在網(wǎng)絡泡泡破滅以后,,當年風起云涌的電子書網(wǎng)站們也紛紛風卷殘云了,,但是打包格式的電子書已經(jīng)深入人心,甚至出現(xiàn)“TXT,、HTML格式不能算是電子書”的井底論調(diào),,電子書的制作、傳播也開始以非盈利性質(zhì)的BBS為主力,,如我當年常去的52ebook,、rbook。 剛開始的時候,,52ebook和rbook有點同質(zhì)競爭的味道,,經(jīng)常出現(xiàn)一本書兩邊都發(fā)的情況,但是經(jīng)過幾次事件后,,逐漸發(fā)展出了自己的特色:52ebook以EXE,、CHM為主,,rbook以PDF為主。 CHM比較單純,,EXE格式就比較花花了,我在4年前寫的《常見電子書格式及其反編譯思路》中有所介紹,。不過這篇文章寫得比較早,,所以漏了后來風行一時的一種電子書——用Desktop Author(DA)制作的翻頁電子書。在DA的官方網(wǎng)站上,,對DA電子書的適用范圍其實有清晰的界定,但是因為其花哨的界面,,與某些國人的習性不謀而合,因此受到熱烈的追捧,,不管文本,、圖片甚至漫畫電子書都用它。但是我因為在其他方面有過切身教訓,,所以當這種電子書剛剛在52ebook興起的時候,,就發(fā)了一篇《翻頁電子書的隱憂》,建議別什么書都往DA上靠,,不然早晚會后悔,。遺憾的是,我當年在52ebook上僅有的兩次爭執(zhí),,都是與DA的fans發(fā)生的,最終導致我對迷戀DA的人本身都產(chǎn)生了rpwt方面的懷疑,。各位盡可說這是我狹隘的個人偏見,但我相信我當年的隱憂現(xiàn)在都得到了驗證,,至少DA的fans是日漸稀少了,,以前留下來的DA書大概也都成了雞肋,。 當然當年的52ebook還是以HTML格式為素材的電子書為主,,剛開始的時候是一本書一個文件,大家覺得看起來比較不過癮,,開始出現(xiàn)制作合集(把同一作者或同一題材的作品打包成一本書)的熱潮,并且出現(xiàn)以制作合集成名的人物,,甚至成為當年52ebook的招牌產(chǎn)品,,如大名鼎鼎的《云中孤雁武俠系列合集》等,。不可否認,,這些合集的推出,確實方便了大家的閱讀,,但是由于一個合集可能包含幾十本作品,,因此難免出現(xiàn)“重量不重質(zhì)”的問題,很多合集制作者都是把網(wǎng)上搜集的素材往模板上一套,,然后換個圖片,、打包了事。至于素材有沒有問題,、文字全不全,,那就不管了,所以這股“合集熱”也受到一些詬病,,不過我本人還是很喜歡合集的,,以前收的單本書基本上都用合集替換了——放心,大家使用的素材都是一樣的,。不過網(wǎng)上感興趣的素材就這么多,,這么做合集總有做完的一天,所以幾位合集達人最后都歸隱了,,但是后來的制作者總不能就此止步:年輕人還有旺盛的精力需要發(fā)泄,,沒成名的還有成名的熱望在推動,沒論壇幣的總不能就靠轉(zhuǎn)貼吃飯,,……所以后來又出現(xiàn)了“合集的合集”,即把幾個作者,,甚至某個國家的一批作者,,管他作品風格如何,就捏在一起推出一個合集,。我以小人的陰暗心理推測,,這也是沒有辦法的辦法:可做的合集都被人做過了,改行去做OCR,?太累了,。去做校對?太郁悶了,。還是把別人的合集反編譯了,,重新打包一遍來得方便。 當年在52ebook,,我是主張反編譯最力的人士之一,,不過我的目的與合集制作無關,主要還是出于職業(yè)習慣,令我對所有來路不明的EXE都深懷疑慮,,而且打包電子書沒法用桌面搜索工具搜索,、令反病毒軟件的實時檢測模塊狂耗CPU……如此等等,都令我迫切希望把到手的每一本打包電子書都反編譯成原始素材,。為此,我花費了一個多月的時間在Windows 2000源代碼的海洋中四處尋覓,。最終的結(jié)果還算令我滿意,,不僅得到了通用的反編譯IE內(nèi)核電子書方法,中間的研究過程還產(chǎn)生了一些有趣的副產(chǎn)品,,被我應用到了其他相關軟件中,。但是其中最重要的成果,,我認為還是終于掌握了一種研究這份源代碼的有效方法,,按照這種方法,,任何一個合格的Windows程序員都可以在幾分鐘之內(nèi)定位到我花費了一個多月才找到的那段代碼,即KillEBook/IECracker核心的基礎,。4年時間過去了,,雖然中間數(shù)次有人表達了想仿制的決心,,但是至今KillEBook/IECracker仍然是獨此一家,,絕無分號…… 順便一提,,當年在我去過的某個以電子書為主的BBS的C/C++語言區(qū),,曾經(jīng)有人發(fā)貼問過這份Windows 2000源代碼有沒有用,當時該BBS的人氣還不算太難看,,但是絕大多數(shù)人的回答卻是“沒用”,,甚至出現(xiàn)“可以打印出來當茶杯墊”的論調(diào)。從此以后,,我對該BBS的所謂“技術”再無絲毫興趣,,也再沒去過那個BBS,,前幾天收藏夾點錯了誤入一次,,果然發(fā)現(xiàn)人氣已盡,。 在解決了反編譯問題后,,我從52ebook下載的電子書基本上都被我反編譯了,壓縮成zip后用MyReader看,。但是在LP送我一個西門子SL55手機后,我才發(fā)現(xiàn)原來手持設備也是個好東東啊,,真正實現(xiàn)了讀書人夢寐以求的“隨時隨地,,皆可讀書”,。所以久已遺忘的TextForever又被我撿了起來,,并且加入了新的功能,。甚至在后來投入PDG的懷抱后,我也念念不忘把PDG OCR成文本,。 在52ebook混久了以后,,我也發(fā)現(xiàn)了它的固有問題:想看時文沒有問題,越時髦,、越熱門,、越快餐的越能找到,,但想找有點專業(yè)背景的就難了,,就算能找到,,其權威性也很難令人放心,。這個問題的根源其實在于網(wǎng)絡上的文本素材:時文可以從新浪讀書頻道,、各文學BBS等找到,專業(yè)書籍沒人會在網(wǎng)上首發(fā),,想看文本只能靠OCR,、校對,,但是受讀者群的限制,,又有幾個人愿意從事這樣的苦工? 正好在這個時候,,rbook上開始流行掃描版PDF,,內(nèi)容都是一些具有專業(yè)背景的書籍,,我一見之下大喜過望,,開始迫不及待的收藏過程。當然我絕對不會相信這些書籍全都是發(fā)書的人自己掃的(沒辦法,,他們發(fā)得實在太快,、太多了),所以留意了一下發(fā)書人的討論,,才知道都是從PDG打印過來的,,而當時大名鼎鼎的幾個發(fā)書人都推薦到readfree網(wǎng)站討論PDG相關問題,,我頭腦一熱也跑到readfree注冊了一下,,不過當時忙著在52ebook,、rbook收書,,所以也沒在readfree上混,。 后來隨著收書范圍的擴大,,我開始收到一些直接以PDG格式提供的書,,迫不得已才想起來到readfree逛逛,。由于受rbook慣性思維影響,,我當時想的還是將PDG轉(zhuǎn)成PDF看,。那時readbook管理還沒這么規(guī)范,,我很順利地找到了coolman的pdg2bmp&jpg&tif&pdf&txt,,開始生平第一次自己動手轉(zhuǎn)PDG成PDF(沒辦法,“打印大法”從來就不在我能夠容忍的考慮范圍之內(nèi)),。轉(zhuǎn)了幾次后,我就發(fā)現(xiàn)coolman的軟件有一個對我來說比較致命的問題:需要占用系統(tǒng)剪貼板,。由于轉(zhuǎn)換過程一般比較長,我都是邊轉(zhuǎn)換邊干別的,,不能用剪貼板實在太難受,。當然這個問題之后沒多久就被coolman自己解決了,但是當時搞得我實在難受,,所以先上網(wǎng)搜了一下,,大致知道coolman軟件的原理,,既然是用ActiveX控件,,為什么不用得更加優(yōu)雅一點,?所以我就用另外的公開接口,,開發(fā)了第一版Pdg2Pic,,及配套的FreePic2Pdf,。其實在最初的時候,,這兩個軟件是打算象coolman那樣合一的,但是開發(fā)到一半就發(fā)現(xiàn)那樣太麻煩,,而且在其他場合也存在將標準圖像文件轉(zhuǎn)換成PDF的需求,,所以就分開了。在試著轉(zhuǎn)了幾本書后,,我發(fā)現(xiàn)分步轉(zhuǎn)換出來的PDF,,要比一次到位轉(zhuǎn)出來的更能令我滿意,,以后就再沒考慮過兩個軟件合并的事情,。 第一版Pdg2Pic雖然存在許多問題,,但還是很幸運地引起了拽拽,、coolman等人的注意(據(jù)coolman說他之前就已經(jīng)從其他地方知道我了),介紹我進入了某個人才薈萃的地方,,在那里不僅有coolman,,還有cheming,、hstong、小洋白菜(qdlsy),、伊茲魚等PDG達人,,從他們那里我不僅獲得了后續(xù)Pdg2Pic發(fā)展所需的技術,,更重要的是解決了我急需的PDG下載問題,?;旧?,在我到readfree之前根本就不知道有6xH的存在,而等我進入readfree后,,在見識到真正的6xH之前,我就確信我這輩子大概都不會下載到6xH了(cheming似乎也有此問題,,他開發(fā)PIZZA所需的最初幾個6xH文件就是在readfree上開貼購買的)。所以時至今日,,Pdg2Pic都不支持6xH,雖然從理論上說,,基于ActiveX控件的解碼軟件至少能夠解碼自己本機下載的6xH文件,,但對我來說實在沒用。如果對用ActiveX解碼PDG感興趣,,可以看一下我寫的《用Pdg2.DLL解碼PDG的境界》,,當然不保證人人都能看得懂。 當時在那個地方,,充滿了濃郁的技術討論氣氛,,記得cheming曾經(jīng)感嘆過:“這是我到過的最有技術氣氛的地方”。而我在中間曾經(jīng)出差過一個星期,,回來后做的第一件事就是把出差期間其他人的所有發(fā)言從頭到尾看一遍,一個字都不敢放過,。充分的交流當然會產(chǎn)生豐碩的成果,,而所有成果都是共享的。在hstong因為我們的在線反饋而一天之內(nèi)7次升級自己的軟件后,,我也忍不住發(fā)表感慨:“花真金白銀買的國外名牌原廠專家服務,,都不如這里的免費服務周到,!”,。而拽拽當年“包打聽”的名頭,,我相信至少有一部分要歸功于此處。 在解決了基本問題后,,我對PDG的熱情迅速高漲,,甚至專門到淘寶網(wǎng)上購買了超星讀書卡以示支持,而Pdg2Pic+FreePic2Pdf也開始廣為流傳,,為此我還專門在rbook發(fā)了教程和例子,,希望能夠影響其他人,,制作出更多高質(zhì)量的PDF電子書,??上У筋^來,,大多數(shù)人還是只想用軟件最基本的功能,,很少有人能夠理解分步轉(zhuǎn)換的真意,要求實現(xiàn)批量轉(zhuǎn)換的呼聲更是不絕于耳,,搞得我對轉(zhuǎn)換再沒啥興趣,,卻對OCR開始感興趣。如上所示,,我很早以前就從52ebook上發(fā)現(xiàn)網(wǎng)絡資源匱乏導致EXE電子書同質(zhì)化的問題,,不過那時我手上沒啥資源,所以雖然知道問題,,卻無對策。而一頭扎進PDG后,,圖版資源不再是問題,,OCR也可以用Office 2003,,所有條件都已具備,差的只是人了,。所以我在52ebook上開始號召大家OCR,,自己也帶頭OCR了幾本書,。經(jīng)過長期的、不懈的,、連誘惑帶激將的艱苦努力,,這個號召終于得到幾個人的響應(沒夸張,真的只是“幾個”),,但是隨著52ebook的關閉,,這事也就此無下文了,留下來的大概只有為方便OCR校對而制作的一本《漢典離線精簡版》,。 這時rbook對我的作用也發(fā)生了變化,我不再收藏上面的任何PDF,,每天還是必去,,看到感興趣的書還是必下,看過之后如果覺得有必要保留,,都會刪掉下載的PDF,,重新下載清晰版的PDG:我覺得在讀秀、lr上漫無目的地搜索太無聊了,,所以把rbook和readfree的求書區(qū)當作了索引,,經(jīng)常上去看看。 在折騰PDG的同時,,我在hstong的影響下,,到中美百萬逛了一下,看了幾本DjVu格式的電子書,。與其他人不同,,DjVu格式對我最大的吸引力并不是所謂的“高壓縮比”,而是DjVu格式最常用的瀏覽工具WinDjView,。我看電子書的時候,,一般喜歡選擇縮放至窗口寬度,但是Acrobat有個最令我痛恨的地方:如果PDF頁面大小不統(tǒng)一,,顯示到后面更寬的頁面時,,前面窄頁就會縮小,搞得我很是惱火,,F(xiàn)reePic2Pdf就沒少在這方面動腦子,。而WinDjView完全沒有這方面的問題,只要設定了“適合寬度”,,所有頁面就會整整齊齊地縮放到窗口寬度,,絕對不像Acrobat那樣毫無節(jié)操。再加上Acrobat用多了以后,,總覺得與我原來慣用的ComicsViewer相比,,缺少了一些我最習慣的功能,用起來有點難受。所以開始考慮把幾個軟件的特點綜合在一起,,開發(fā)一個PDG專用瀏覽器,,即后來的UnicornViewer。雖然今天的UnicornViewer已經(jīng)支持PDF,、DjVu,,但骨子里這些都不過是附帶的,最根本的目的還是PDG,。所以自從UnicornViewer問世以后,,我就開始對以前下載的PDF進行洗牌,如今已全部洗成了清晰版PDG,。話說回來,,似乎不論收藏什么,到了一定程度都必然要洗牌,,洗啊洗的也就習慣了,。 總之,在readfree各路高手的無私幫助下,,讓我見識到超星,、讀秀、中美百萬等地方,,我才終于明白了什么叫做電子圖書館,,什么叫做電子書,也從此一頭扎進去,,到現(xiàn)在還沒出來,,在可預見的將來也沒打算出來,而我與reafree的緣分也還會繼續(xù)下去,。 |
|