在以“大數(shù)據(jù)”“云計(jì)算”為時(shí)代特色的今天,,古籍的整理,、漢字的研究能夠而且非常有必要以這種新理念為指導(dǎo),在思路方法,、材料處理,、結(jié)果展示等方面作出創(chuàng)新,以進(jìn)一步提升研究的信度和效度,。就漢字的整理而言,,李國(guó)英從存在方式入手,將整理對(duì)象分為“使用狀態(tài)的漢字”和“儲(chǔ)存狀態(tài)的漢字”兩類,。具體到古籍中的漢字,,我們認(rèn)為,前一種指類似于諸子百家,、詩詞歌賦,、小說話本及“二十四史”等真實(shí)文本中上下文所使用的漢字,后一種主要指以《說文解字》《爾雅》《方言》《釋名》為代表的“小學(xué)”類專書中收釋的漢字,?!靶W(xué)”類專書事實(shí)上已經(jīng)對(duì)其時(shí)可見的真實(shí)文本中的用字進(jìn)行過整理,,故而對(duì)該類專書中收錄的漢字再行整理,,便成為整理“使用狀態(tài)的漢字”的前提和基礎(chǔ)。自漢至清,,“小學(xué)”類專書不斷涌現(xiàn),。此類專書有的偏重分析被釋字的形體,有的偏重歸納被釋字所記錄的詞義,有的偏重厘定被釋字的音讀,。但也有一類“小學(xué)”專書,,它們兼?zhèn)湮淖帧⒙曧?、?xùn)詁特色,,這便是專門訓(xùn)釋漢文佛經(jīng)文獻(xiàn)中疑難字詞的著作?;谶@一事實(shí),,以漢文佛經(jīng)音義類著作為例,從“大數(shù)據(jù)”“人工智能”等時(shí)代背景出發(fā),,探究“小學(xué)”類專書文字整理與研究的變革及創(chuàng)新問題,。 現(xiàn)存漢文佛經(jīng)音義類著作,一方面在解釋佛經(jīng)中的疑難字詞時(shí),,間接保存了不少其他字書,、韻書、訓(xùn)詁書中的訓(xùn)釋材料,;另一方面,,盡管該類著作主要成書于唐五代,但其中收錄的文字現(xiàn)象多是歷時(shí)的,,同時(shí)也是多元的,。此外,漢文佛經(jīng)音義中也收集了佛經(jīng)翻譯時(shí)新造的一些切身字,、兩聲字,、咒語字、真言字等,,還有不少因上下文字的影響而產(chǎn)生的“同化字”和因詞義或構(gòu)件的聚合性而生成的“類化字”,。因此,系統(tǒng)整理其中的文字資料,,厘清所涉及的相關(guān)字詞的關(guān)系,,既能促進(jìn)對(duì)佛經(jīng)用字的整理,也可為“小學(xué)”類專書乃至全漢字整理工作積累資料,、經(jīng)驗(yàn)和方法,。 盡管上述幾種漢文佛經(jīng)音義成書后曾廣泛流傳,然而對(duì)它們真正意義上的研究則始自清末,。綜合來看,,目前對(duì)漢文佛經(jīng)音義進(jìn)行專書文字整理與研究的成果并不多,有些這類著作尚未得到充分關(guān)注,?;诖?,我們擬將漢文佛經(jīng)音義的刻本和寫本材料放置在統(tǒng)一的研究平臺(tái)上,用歷史考證法和綜合分析法,,從漢文佛經(jīng)音義內(nèi)部及與之相關(guān)的佛經(jīng)文獻(xiàn)外部,,做定量和定性研究,以為全漢文佛經(jīng)的整理與???、漢字整理的立體化、古籍??钡淖詣?dòng)化,、漢字國(guó)際編碼的科學(xué)化等提供可參用的材料及可借鑒的經(jīng)驗(yàn)。具體來看,,漢文佛經(jīng)音義文字整理與研究的變革及創(chuàng)新包括如下幾個(gè)關(guān)鍵點(diǎn),。 第一,普查并搜集漢文佛經(jīng)音義現(xiàn)存的主要版本,,對(duì)搜集到的版本進(jìn)行源流探察,、基礎(chǔ)信息標(biāo)注、數(shù)字化處理等,,構(gòu)建漢文佛經(jīng)音義的“版本資源庫”,。提取出不同版本中的異文現(xiàn)象,考探每組異文的關(guān)系屬性,,比如字際關(guān)系,、詞際關(guān)系等;考證異文中的相關(guān)訛字,、俗字,,考求異文展現(xiàn)出的一些方言俗語的結(jié)構(gòu)與意義;考察異文折射出的刻寫者,、刻寫時(shí)代的用字特征,,辨析由異文造成的經(jīng)義的某些差別。在此基礎(chǔ)上,,進(jìn)一步總結(jié)漢文佛經(jīng)音義版本間異文出現(xiàn)的規(guī)律,,揭示異文中錯(cuò)訛現(xiàn)象發(fā)生的動(dòng)因,辨別版本的異同及優(yōu)劣,。 第二,,更加深入地校勘漢文佛經(jīng)音義的文本,,進(jìn)一步推進(jìn)“計(jì)算機(jī)輔助古籍版本??薄钡睦碚撆c實(shí)踐研究。從傳統(tǒng)來看,,??惫ぷ髦械摹皩?duì)教”“本校”“他?!薄袄硇,!钡榷际怯扇斯ね瓿傻模欢偶,?笔且豁?xiàng)“勞動(dòng)密集型”的工作,。為了更高效地完成校勘工作,,北京師范大學(xué)的周曉文在《計(jì)算機(jī)輔助古籍版本??辟Y源庫建設(shè)淺議》等論著中,提出了“計(jì)算機(jī)輔助古籍版本??薄钡睦砟?。該方法對(duì)傳統(tǒng)做出了改變,它能提高??彼俣群托,?毙Ф龋苁剐,?背晒麑?shí)現(xiàn)“累積—利用—再累積”的良性循環(huán),,能發(fā)現(xiàn)人工校勘不容易發(fā)現(xiàn)的新問題,,能實(shí)現(xiàn)計(jì)算機(jī)輔助“??庇洝钡淖詣?dòng)生成。不過,,該理論方法目前并不成熟,,我們需要利用漢文佛經(jīng)音義這批材料,進(jìn)一步推進(jìn)“計(jì)算機(jī)輔助古籍版本??薄钡睦碚撆c實(shí)踐研究,。 第三,輯錄并考辨漢文佛經(jīng)音義所釋的文字,,完善漢字字際關(guān)系的理論體系,。前者重點(diǎn)包括厘析所系聯(lián)的每組文字的字際關(guān)系,考證部分疑難未識(shí)字,,考察所溝通的部分文字在其他辭書中的收錄情況及在真實(shí)文本中的使用情況,,梳理部分形體或構(gòu)件的歷史演變軌跡,辨正《漢語大字典》《中華字?!返茸謺械哪承┦枵`,。在系統(tǒng)考辨的基礎(chǔ)上,進(jìn)一步考察漢文佛經(jīng)音義中涉及的詞匯興替,、俗語變遷的機(jī)制與動(dòng)因等,。不過,,在判定所釋文字的具體字際關(guān)系之前,我們需要進(jìn)一步明確漢字字際關(guān)系的理論體系及其構(gòu)成要素,。佛經(jīng)音義釋文中常出現(xiàn)“古字”“非體”“近字”“本字”“俗字”“假借用”等表達(dá)字詞關(guān)系的用語,,當(dāng)今學(xué)界常用“異體字”“正俗字”“通假字”“古今字”“假借字”“同形字”“同源字”等術(shù)語來表達(dá)文字關(guān)系。然而從其所指來看,,這些用語或術(shù)語有的彼此間有交叉,,有的則分屬于不同的范疇。再比如,,由同一結(jié)構(gòu)演變而來的一組形體,,哪些為書寫訛誤,哪些為一字異體,,也需要有較為明確的判定標(biāo)準(zhǔn),。 第四,構(gòu)建漢文佛經(jīng)音義“字料庫”,,將所釋的文字予以立體展示,。目前已有的《可洪音義》文字整理表的特征是原始聚集、平面展示,,而實(shí)際上其內(nèi)部往往存在層級(jí)和序列,。就漢文佛經(jīng)音義所釋文字的整理而言,借助李國(guó)英,、周曉文二先生在《字料庫建設(shè)的必要性與可行性》等論著中提出的“字料庫”理論和方法,,則是一種較為新穎的做法。它在數(shù)據(jù)的提取與加工方面,,表現(xiàn)為自動(dòng)切圖,、自動(dòng)識(shí)別、自動(dòng)標(biāo)注,;在材料的??狈矫妫憩F(xiàn)為計(jì)算機(jī)自動(dòng)比對(duì)與人工校理相結(jié)合,;在疑難字考釋方面,,表現(xiàn)為相關(guān)文字形、音,、義,、用信息的同平臺(tái)展示;在整理結(jié)果的呈現(xiàn)方面,,表現(xiàn)為立體化,、全視角、綜合性的布列。 第五,,利用漢文佛經(jīng)音義探究異體字整理的新模式,。異體字整理是漢字整理的重點(diǎn)內(nèi)容之一,目前常見的做法是對(duì)單組文字進(jìn)行認(rèn)同或別異,,再據(jù)此整理出平面的字表,。事實(shí)上,異體字內(nèi)部常存在層級(jí),,這些不同的層級(jí)多構(gòu)成異體字“樹模”,,每個(gè)“樹?!笨蛇x定一個(gè)代表字,代表字下常有不同的異構(gòu)字,,其下多會(huì)有不同的異寫字,;同時(shí),異構(gòu)字和異寫字也常有不同的層級(jí),。由此來看,,運(yùn)用立體分級(jí)的方法研究異體字,可以更好地展現(xiàn)其發(fā)展規(guī)律,,也更利于對(duì)異體字的形成過程進(jìn)行描寫和分析,。漢文佛經(jīng)音義中收錄的文字大多都是異體字,在考察這些異體字的字組關(guān)系,、衍生關(guān)系,、層級(jí)關(guān)系等基礎(chǔ)上,可進(jìn)一步創(chuàng)新“樹?!苯Y(jié)構(gòu)的異體字整理模式,。 第六,細(xì)化漢字國(guó)際編碼的字形認(rèn)同與別異規(guī)則,,提取出漢文佛經(jīng)音義中的未編碼字,。就漢字國(guó)際編碼的發(fā)展現(xiàn)狀而言,目前我們一方面需要進(jìn)一步提取尚未編碼的漢字,,另一方面需要優(yōu)化漢字國(guó)際編碼的認(rèn)同規(guī)則,。事實(shí)上,要想實(shí)現(xiàn)漢譯佛經(jīng)文獻(xiàn)的全數(shù)字化,,首先需要將漢文佛經(jīng)音義中的未編碼字全部提取出來,整理之后提交國(guó)際編碼組織,。不過,,在提取佛經(jīng)音義中的未編碼字時(shí),,常會(huì)碰到一種現(xiàn)象,即某些字圖與已編碼的漢字不完全一致,,究竟哪些可以用已經(jīng)編碼的字去替代,哪些需要標(biāo)為未編碼,?有時(shí)字圖中的形體尚未編碼,,哪些有差異的字圖本質(zhì)上屬于同一個(gè)字,哪些需要視作不同的字,?對(duì)于這些問題,,我們均需要從影響漢字形體變異的地域、時(shí)代,、書寫等因素出發(fā),,以《CJK漢字的認(rèn)同程序和排序》為基礎(chǔ),,結(jié)合漢文佛經(jīng)音義中的相關(guān)字形,,制定出更加完善的認(rèn)同細(xì)則,。 總之,,在人工智能等新時(shí)代理念的指引下,,借助“計(jì)算機(jī)輔助古籍版本??薄薄白至蠋臁钡染唧w理論方法,,對(duì)漢文佛經(jīng)音義等“小學(xué)”類專書中的文字進(jìn)行輯錄整理與多維研究,,可使得整理理念更加先進(jìn)、整理模式更加立體,、整理過程更加可控、整理結(jié)果更加科學(xué),。 |
|