[摘要] 闡述了數(shù)據(jù)挖掘技術(shù)在方劑學(xué)研究中的常用方法和在方藥配伍及用藥規(guī)律中的應(yīng)用,說明其在方劑研究中存在缺乏規(guī)范化,、評(píng)價(jià)方法和研究人員知識(shí)結(jié)構(gòu)差異性等問題,,并提出了建立數(shù)據(jù)庫和研究系統(tǒng)標(biāo)準(zhǔn)化、進(jìn)行數(shù)據(jù)預(yù)處理,、采用多元化挖掘方法,、確立評(píng)價(jià)體系、培養(yǎng)兼?zhèn)渲嗅t(yī)藥知識(shí)與計(jì)算機(jī)技術(shù)研究人員的發(fā)展對(duì)策,。 數(shù)據(jù)挖掘是一種多方位,、多領(lǐng)域、多技術(shù)相互交錯(cuò)的研究方法,,可以對(duì)信息庫中的數(shù)據(jù)進(jìn)行分析和管理,,能極大降低數(shù)據(jù)科研分析難度,在各學(xué)科廣泛使用,。它對(duì)數(shù)據(jù)的高度抽象與概括,,使數(shù)據(jù)由感性升華到理性認(rèn)識(shí)的特性,在對(duì)中醫(yī)藥資源進(jìn)行知識(shí)的獲取研究時(shí)具有去偽存真,、去粗取精的功能,,是中醫(yī)藥現(xiàn)代化研究的重要組成部分,,在方劑學(xué)研究中也具備較高適用性,。方劑學(xué)文獻(xiàn)中廣泛包括治法治則、配伍規(guī)律及臨床應(yīng)用,,其中蘊(yùn)含著大量可信數(shù)據(jù),。在數(shù)據(jù)挖掘技術(shù)的支持下,能夠?qū)χ嗅t(yī)藥理論的方劑配伍及應(yīng)用規(guī)律進(jìn)行有效篩選和整合,,系統(tǒng)地將各類信息加以歸納,,高效研究古今驗(yàn)方,在方劑研究中實(shí)現(xiàn)高效組織,、存儲(chǔ),、管理及深刻整合、挖掘,,為我們深入研究方劑學(xué)創(chuàng)造了新的路徑,。如今,,數(shù)據(jù)挖掘技術(shù)已滲透到方劑學(xué)研究的各個(gè)領(lǐng)域,其良好的適用性使得方劑學(xué)研究更具成效,。 1 數(shù)據(jù)挖掘技術(shù)在方劑學(xué)應(yīng)用的現(xiàn)狀 作為從龐大的模糊數(shù)據(jù)中提取有用信息的新興信息處理技術(shù),,數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)整合處理步入了更高級(jí)時(shí)段。這項(xiàng)技術(shù)不僅能對(duì)從前的數(shù)據(jù)資料進(jìn)行查閱,,還能搜尋出數(shù)據(jù)間微小的潛在聯(lián)系,,促進(jìn)了信息的傳播。中醫(yī)經(jīng)過幾千年的發(fā)展,,大量臨床經(jīng)驗(yàn)得以保存,,并積累了許多方劑資源。如今,,我國(guó)已創(chuàng)建了龐大的方劑數(shù)據(jù)庫,。合理利用數(shù)據(jù)挖掘技術(shù),在方劑數(shù)據(jù)庫中檢索研究,,可以迅速加快中醫(yī)方劑組方配伍的研究,,更能精準(zhǔn)提取到各家方劑中存在的組方配伍規(guī)律,探尋臨床疾病的辨證審因與組方配伍的關(guān)系,,從而為方劑學(xué)的數(shù)據(jù)信息研究提供新的有效方法,。 數(shù)據(jù)挖掘的過程中所利用的技術(shù)越多,則得出的結(jié)果越為精準(zhǔn),。中醫(yī)藥研究中常用的數(shù)據(jù)挖掘方法種類繁多,,可分為關(guān)聯(lián)規(guī)則、聚類分析,、頻數(shù)分析,、粗糙集和人工神經(jīng)網(wǎng)絡(luò)等。邢澤欣提出,,數(shù)據(jù)挖掘?qū)τ诜絼W(xué)可進(jìn)行數(shù)據(jù)庫設(shè)計(jì),、方劑配伍、方劑功效等研究,。而在方法的常用性上,,鄧宏勇等則通過檢索文獻(xiàn)挖掘歷年方藥數(shù)據(jù),經(jīng)過人工的收納整合分析后,,發(fā)現(xiàn)在方劑配伍使用中最廣泛的當(dāng)為關(guān)聯(lián)規(guī)則,,其次是頻數(shù)分析和聚類分析,而人工神經(jīng)網(wǎng)絡(luò)則是中藥現(xiàn)代研究的常用方法,。 與此同時(shí),,不同研究領(lǐng)域所涉略的探尋方向及數(shù)據(jù)挖掘方法各有不同。王靜等提出了如何將數(shù)據(jù)挖掘應(yīng)用于方劑學(xué)研究中,認(rèn)為在利用數(shù)據(jù)挖掘技術(shù)對(duì)方劑學(xué)進(jìn)行研究時(shí),,可應(yīng)用醫(yī)學(xué)多元統(tǒng)計(jì)學(xué),,具體包括聚類分析法、判別分析法,、回歸分析,、利用數(shù)據(jù)倉庫專業(yè)的分析工具及關(guān)注頻繁項(xiàng)?;蚩刹捎萌斯ぶ悄芊椒?,包括模糊數(shù)學(xué)模型應(yīng)用、基于神經(jīng)網(wǎng)絡(luò)的運(yùn)用,。鄔錫琴等則歸納總結(jié)了數(shù)據(jù)挖掘應(yīng)用于方劑學(xué)的領(lǐng)域,,認(rèn)為在具體應(yīng)用中可分為方證規(guī)律探討、基于類方分析的方藥配伍規(guī)律,、醫(yī)家藥物使用特色,,同時(shí)可適用于方藥對(duì)于疾病的特異性研究。 數(shù)據(jù)挖掘的各種方法與方劑學(xué)相互結(jié)合,,在研究的過程中相輔相成,,取得了較好的研究成果。例如,,基于方劑的配伍規(guī)律,,阮時(shí)寶等探尋的結(jié)果主要有兩個(gè):第一,藥對(duì)藥組配伍規(guī)律的研究,。該研究驗(yàn)證了一些古籍與民間經(jīng)驗(yàn)流傳的藥組配伍,,除此之外,更是發(fā)現(xiàn)了許多特殊的藥物配伍,,這項(xiàng)藥對(duì)藥組的研究極大推動(dòng)了方劑學(xué)的發(fā)展,。第二,方-藥-證的規(guī)律探討,。方劑是一門綜合性學(xué)科,,它將中醫(yī)之理、法,、方,、藥囊括其中,,彰顯了辨證審因,、治療方法及用藥理論。方劑的配伍規(guī)律不僅體現(xiàn)在對(duì)藥物的熟練運(yùn)用上,,亦表現(xiàn)在對(duì)患者的辨證論治中,。運(yùn)用數(shù)據(jù)挖掘技術(shù)可以研究中藥的性味歸經(jīng)、藥物功效、炮制用法,、功效主治和方劑類別的歸納對(duì)比,,將傳統(tǒng)的君臣佐使理論與現(xiàn)代的臨床運(yùn)用結(jié)合分析,從整體上完成從辨證察因到組方論治的過程,。楊雪梅等采用分類關(guān)聯(lián)規(guī)律方法,,挖掘出明清時(shí)期脾胃濕熱方的用藥組方及辨治規(guī)律。雍小嘉等在研究的過程中采用《中醫(yī)類方辭典》中所收納的方組為樣本,,將藥對(duì)組方進(jìn)行數(shù)據(jù)量化,,從而確認(rèn)了以藥物高維數(shù)據(jù)歸納方法判明方劑功效的可行性。蔣永光等則從《中醫(yī)大辭典·方劑分冊(cè)》中選取1355首脾胃方,,通過運(yùn)用關(guān)聯(lián)規(guī)則,、分類分析及聚類分析等多種手段,從性味,、歸經(jīng),、劑型、功效,、主治等,,從多層次多領(lǐng)域進(jìn)行總結(jié),最后分析出多種規(guī)律,。綜上所述,,各類數(shù)據(jù)挖掘方法適用于方劑學(xué)研究,并取得了可喜成績(jī),。 由此可見,,方劑研究人員利用數(shù)據(jù)挖掘技術(shù),致力于研究方劑功效,、方劑聚類和方劑關(guān)聯(lián)規(guī)則,,進(jìn)行頻繁的數(shù)據(jù)模式挖掘,并皆有成效,。方劑學(xué)者應(yīng)正確使用數(shù)據(jù)挖掘技術(shù),,通過計(jì)算機(jī)軟件和虛擬智能等多種方法,對(duì)信息庫中的資料進(jìn)行創(chuàng)新性整合,,從而獲得預(yù)期的研究成果,。若想進(jìn)一步完善和證實(shí)中醫(yī)的理論及經(jīng)驗(yàn),可通過數(shù)據(jù)挖掘?qū)χ嗅t(yī)藥方劑文獻(xiàn)數(shù)據(jù)進(jìn)行探索,,創(chuàng)新中醫(yī)藥基礎(chǔ)理論研究,。 2 存在問題與對(duì)策 2.1 存在問題 由于方劑學(xué)研究數(shù)據(jù)不僅包含了經(jīng)方藥對(duì)、實(shí)驗(yàn)結(jié)果記錄,,還包括了現(xiàn)代臨床組方,、配伍療效對(duì)比等,學(xué)者們?nèi)裟苓\(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)其進(jìn)行研究,必能推演出方藥規(guī)律并從中獲益,。但是,,數(shù)據(jù)不等同于知識(shí)和學(xué)術(shù),方劑的關(guān)鍵是配伍與運(yùn)用,,對(duì)它的領(lǐng)悟及使用決定了臨床組方是否合理,,并與中醫(yī)辨證論治時(shí)方劑的效用休戚相關(guān)。就目前而言,,方劑學(xué)數(shù)據(jù)挖掘研究?jī)H僅滿足于挖掘局限的表面規(guī)律和單調(diào)地歸納數(shù)據(jù),,卻不對(duì)方劑系統(tǒng)內(nèi)最重要的機(jī)制或內(nèi)涵進(jìn)行深入探討。不僅如此,,數(shù)據(jù)挖掘技術(shù)應(yīng)用于方劑學(xué)研究屬于新興技術(shù),,其研究系統(tǒng)仍存在紕漏和不完整性,不少學(xué)者在使用數(shù)據(jù)挖掘技術(shù)探討方劑研究時(shí)出現(xiàn)許多不足,。例如阮時(shí)寶等提出方劑學(xué)在數(shù)據(jù)挖掘運(yùn)用上,,存在缺乏規(guī)范化、規(guī)律驗(yàn)證性和研究人員知識(shí)結(jié)構(gòu)差異性的問題,,其中規(guī)范化問題又具體類分為數(shù)據(jù)的預(yù)處理問題及數(shù)據(jù)源的規(guī)范化問題,,并將所有問題進(jìn)行詳細(xì)說明。 2.2 解決方法 如何在方劑學(xué)數(shù)據(jù)信息進(jìn)行挖掘和提煉時(shí),,進(jìn)一步壓縮數(shù)據(jù)結(jié)構(gòu)和提高算法效率,,是今后研究中亟待解決的問題。根據(jù)以上情況,,筆者提出如下幾點(diǎn)解決方法,。 2.2.1 數(shù)據(jù)庫及研究系統(tǒng)的標(biāo)準(zhǔn)化 學(xué)術(shù)界應(yīng)重視方劑數(shù)據(jù)庫的建立,對(duì)數(shù)據(jù)庫中的資源進(jìn)行統(tǒng)一及標(biāo)準(zhǔn)化,,并設(shè)計(jì)出適合方劑學(xué)研究的分析系統(tǒng),,便于研究者有效地完成方劑搜查。研究者在嘗試將數(shù)據(jù)挖掘技術(shù)及機(jī)器學(xué)習(xí)相關(guān)算法用來尋求方劑的配伍關(guān)系,、病證方藥的證治規(guī)律時(shí),,推出了若干方劑分析系統(tǒng)。但是由于科研領(lǐng)域中方劑數(shù)據(jù)庫中的缺漏,,這些方劑分析系統(tǒng)對(duì)半結(jié)構(gòu)化數(shù)據(jù)支持,、數(shù)據(jù)的規(guī)范化和信息的共享方面均存在不足,成熟的方劑分析系統(tǒng)比較少,。故而中醫(yī)學(xué)者在進(jìn)行方劑學(xué)數(shù)據(jù)挖掘時(shí),,經(jīng)常遇到一些無法忽視的問題:數(shù)據(jù)庫中的數(shù)據(jù)錯(cuò)誤或不完整,不同數(shù)據(jù)庫檢索結(jié)果不一致,,數(shù)據(jù)庫中存在錯(cuò)誤的,、冗余的、無效的和不一致的噪聲數(shù)據(jù),,對(duì)結(jié)果進(jìn)行分析時(shí)部分結(jié)論與中醫(yī)理論不符合等,。這些問題不僅造成中醫(yī)學(xué)者在數(shù)據(jù)挖掘過程中研究的繁瑣化,而且需要進(jìn)行數(shù)據(jù)預(yù)處理,,增加了研究難度,,如果數(shù)據(jù)預(yù)處理不到位,會(huì)使得研究結(jié)果缺乏可信度,,難以達(dá)到預(yù)期要求,。建立數(shù)據(jù)庫資源標(biāo)準(zhǔn)化及研究系統(tǒng)的標(biāo)準(zhǔn)化能有效地解決這個(gè)問題。 2.2.2 進(jìn)行數(shù)據(jù)預(yù)處理 方劑學(xué)者在收集研究數(shù)據(jù)時(shí)應(yīng)避免疏漏,,對(duì)遺失數(shù)據(jù)進(jìn)行有效處理,,并重視患者隱私保護(hù)工作。方劑學(xué)研究數(shù)據(jù)來源廣泛,、跨時(shí)較大,、千差萬別,不僅包含了文獻(xiàn)古籍,、實(shí)驗(yàn)數(shù)據(jù),,而且還有醫(yī)生對(duì)患者開具的處方用藥以及方劑中迥然相異的中藥配伍等,具有數(shù)據(jù)量大和數(shù)據(jù)類型復(fù)雜的特性,。研究人員在系統(tǒng)而完整的方劑學(xué)數(shù)據(jù)庫規(guī)范化出來之前,,應(yīng)盡可能收集可用數(shù)據(jù),并合理解決部分?jǐn)?shù)據(jù)的缺損問題,。例如,,在對(duì)方劑學(xué)臨床數(shù)據(jù)的整理上,研究人員應(yīng)對(duì)非規(guī)范的原始數(shù)據(jù)進(jìn)行有效的預(yù)處理,,整理患者遺失的病案記錄,,消除數(shù)據(jù)中的錯(cuò)誤和不一致,使數(shù)據(jù)規(guī)范,、準(zhǔn)確和有序,,便能在方劑學(xué)研究中順利挖掘出其中的規(guī)律。此外,,在收集臨床數(shù)據(jù)時(shí)研究人員應(yīng)注意患者個(gè)人私密性問題,,將保密工作貫徹于數(shù)據(jù)提取全過程中。 2.2.3 采用多元化的數(shù)據(jù)挖掘方法 數(shù)據(jù)挖掘技術(shù)是一種從眾多有效數(shù)據(jù)中獲取有價(jià)值信息的研究手段,,能否全面地分析數(shù)據(jù)與結(jié)果的可信度息息相關(guān),。然而,目前有關(guān)方劑配伍理論的研究多是采用單一方法,,這就使得研究結(jié)論不可避免地帶有一定的局限性,。其主要表現(xiàn)在對(duì)相同的數(shù)據(jù)缺乏不同方法間的比較,,而整體數(shù)據(jù)又缺少不同方法間的聯(lián)合應(yīng)用等。中醫(yī)學(xué)者在對(duì)方劑學(xué)研究數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘時(shí),,若只選擇一種方法,,便會(huì)使挖掘出的研究結(jié)論缺乏完整性,降低了結(jié)果的可信度,,不能科學(xué)全面地說明問題,。因此,研究人員在運(yùn)用數(shù)據(jù)挖掘技術(shù)時(shí),,應(yīng)做到多種方法共施,,或?qū)⑽墨I(xiàn)規(guī)律研究和數(shù)據(jù)挖掘的多種技術(shù)相結(jié)合,既能彌補(bǔ)單一方法的不足,,又能充分發(fā)揮各種研究方法的優(yōu)勢(shì),。 2.2.4 確立評(píng)價(jià)體系 由于目前在方劑學(xué)研究中挖掘出的方藥配伍、用藥規(guī)律等結(jié)果,,在冪律分布擬合,、節(jié)點(diǎn)相似性分析等方面存在主觀性的經(jīng)驗(yàn)判斷,必須由經(jīng)驗(yàn)豐富的臨床醫(yī)生或權(quán)威專家評(píng)價(jià)其準(zhǔn)確性,,缺乏必要的理論分析及證明,。這種反饋遲緩、客觀性差的驗(yàn)證手段,,造成了研究結(jié)果的正確性難以驗(yàn)證,、有效性評(píng)判滯后的現(xiàn)狀,學(xué)者在做研究時(shí)應(yīng)該避免一些人為的因素,。因此,,建議確立一套適用于中醫(yī)藥數(shù)據(jù)挖掘研究的科學(xué)性評(píng)測(cè)指標(biāo)機(jī)制,驗(yàn)證性的實(shí)驗(yàn)方法也是可以考慮的,。 2.2.5 培養(yǎng)兼?zhèn)渲嗅t(yī)藥知識(shí)與計(jì)算機(jī)技術(shù)的研究人員 平衡中醫(yī)藥知識(shí)與計(jì)算機(jī)技術(shù)的能力,,使研究成果既具備中醫(yī)理論的整體性,又體現(xiàn)數(shù)理方面的客觀性,。研究人員往往分為兩種:一是中醫(yī)學(xué)者,,擅長(zhǎng)治病方藥等理論經(jīng)驗(yàn),對(duì)數(shù)據(jù)操作稍顯薄弱,;二是計(jì)算機(jī)研究人員,,專于數(shù)據(jù)搜查歸納,而缺乏中醫(yī)知識(shí),。方劑學(xué)數(shù)據(jù)挖掘的結(jié)論應(yīng)該是詳盡而規(guī)整的,,若不能平衡中醫(yī)理論和數(shù)據(jù)的使用,則會(huì)造成結(jié)果的偏頗,。數(shù)據(jù)挖掘?qū)I(yè)與中醫(yī)藥專業(yè)交流少,,行業(yè)信息不能互通,。所以,培養(yǎng)一批兼?zhèn)涠咧R(shí)結(jié)構(gòu)的研究人員刻不容緩,。 3 小結(jié) 方劑有獨(dú)特的配伍規(guī)律,,文獻(xiàn)研究可整合藥物組方進(jìn)行歸納,臨床研究依靠配伍對(duì)各種疾病進(jìn)行有效治療,。由于醫(yī)學(xué)領(lǐng)域的復(fù)雜性和延伸性,,中醫(yī)各家所記載的各類組方,,其配伍規(guī)律所涉信息量龐雜,,故而對(duì)方劑資源進(jìn)行信息化研究必定是個(gè)繁瑣而龐大的工程,僅僅依靠傳統(tǒng)的人工查閱的方法是不可能實(shí)現(xiàn)的,。為了能對(duì)方劑進(jìn)行詳盡而系統(tǒng)分析,,我們必須使用最先進(jìn)的現(xiàn)代信息處理技術(shù)去認(rèn)識(shí)、去分析,、去探究,。計(jì)算機(jī)挖掘技術(shù)能精準(zhǔn)、迅速地找出醫(yī)學(xué)辨證與治法的規(guī)律,,適用于方劑學(xué)的研究,。中醫(yī)學(xué)者將數(shù)據(jù)挖掘所得出的結(jié)果和方劑學(xué)理論知識(shí)的相互融合,不僅可以把自己所掌握的中醫(yī)理論與計(jì)算機(jī)挖掘出的結(jié)論結(jié)合起來,,使臨床辨證療效倍增,,還能加強(qiáng)自身對(duì)名老中醫(yī)獨(dú)特的個(gè)性化診療方法的領(lǐng)悟,吸收內(nèi)在的新理論,、新手段,、新技術(shù),使珍貴的方藥和組方經(jīng)驗(yàn)得到有效傳承,。在研究過程中,,注意對(duì)收集的信息進(jìn)行有效數(shù)據(jù)預(yù)處理,并合理規(guī)范地使用數(shù)據(jù)挖掘技術(shù),,方能從挖掘出的成果中領(lǐng)悟到方劑學(xué)的理念和精髓,。 |
|