引文分析法,就是利用各種數(shù)學(xué)及統(tǒng)計(jì)學(xué)的方法進(jìn)行比較,、歸納,、抽象、概括等的邏輯方法,,對(duì)科學(xué)期刊,、論文、著者等分析對(duì)象的引用和被引用現(xiàn)象進(jìn)行分析,,以揭示其數(shù)量特征和內(nèi)在規(guī)律的一種信息計(jì)量研究方法,。引文分析方法的數(shù)學(xué)基礎(chǔ)是概率論與數(shù)理統(tǒng)計(jì)。在進(jìn)行分析比較時(shí),,已將其作用排除在測(cè)度結(jié)果之外了,。 引文分析法的類型 從不同的角度和標(biāo)準(zhǔn)來劃分,引文分析方法有著不同的類型,。如果從獲取引文數(shù)據(jù)的方式來看,,有直接法和間接法之分。前者是直接從來源期刊中統(tǒng)計(jì)原始論文所附 的被引文獻(xiàn),,從而取得數(shù)據(jù)并進(jìn)行引文分析的方法,;后者則是通過“科學(xué)引文索引”(SCI)、“期刊引用報(bào)告”(JCR)等引文分析工具,,查得引文數(shù)據(jù)再進(jìn) 行分析的一種方法,。若從文獻(xiàn)引證的相關(guān)程度來看,則有自引分析,、雙引分析,、三引分析等類型。如果從分析的出發(fā)點(diǎn)和內(nèi)容來看,,引文分析大致有三種基本類型: 1.引文數(shù)量分析:主要用于評(píng)價(jià)期刊和論文,;研究文獻(xiàn)情報(bào)流的規(guī)律等。 2.引文網(wǎng)狀分析:主要用于揭示科學(xué)結(jié)構(gòu),、學(xué)科相關(guān)程度和進(jìn)行文獻(xiàn)檢索等,。 3.引文鏈狀分析:科技論文間存在著一種“引文鏈”,如文獻(xiàn)A被文獻(xiàn)B引,B被文獻(xiàn)C引,,C又被文獻(xiàn)D引,,等等。對(duì)這種引文的鏈狀結(jié)構(gòu)進(jìn)行研究可以揭示科學(xué)的發(fā)展過程并展望未來的前景,。 引文分析法的基本內(nèi)容 從不同的角度或從各種基本要素出發(fā),,對(duì)科學(xué)引文的分布結(jié)構(gòu)進(jìn)行描述和分析,便形成引文分析的基本內(nèi)容,,一般包括: 1.引文年代分析:一般來說,,隨著年度的由遠(yuǎn)而近,引文量呈增長(zhǎng)趨勢(shì),,即時(shí)間愈近,,被引用的文獻(xiàn)愈多;文獻(xiàn)被利用的峰值是該文章發(fā)生以后的第二年,。如果以 引文年代為橫軸,各年引文量為縱軸,,在坐標(biāo)圖上描繪各年數(shù)據(jù)點(diǎn),,然后用一條線連接起來,便可得到一條引文年代分布曲線,。通過對(duì)該曲線的分析,,不僅可以了解 被引文獻(xiàn)的出版、傳播和利用情況,,而且可以研究科學(xué)發(fā)展的進(jìn)程和規(guī)律,,特別是在文獻(xiàn)老化和科技史的研究中,引文年代分析更是一種廣泛應(yīng)用的有效方法,。 2.引文量分析:引文量是某一主體對(duì)象含有的參考文獻(xiàn)數(shù)量,。它是引文鏈的基本特征之一。通過引文數(shù)量的分析,,不僅可以揭示文獻(xiàn)引證與被引證雙方的相互聯(lián) 系,,而且還可以從定量的角度反映出主體之間的聯(lián)系強(qiáng)度。如果兩篇論文或兩種期刊之間的引文數(shù)量大,,就可以認(rèn)為它們之間的引證強(qiáng)度大,,說明其聯(lián)系較緊密。引 文量的分布規(guī)律可從下列幾個(gè)方面分析: (1)引文量的理論分布:我們將一定量的論文的引文量數(shù)據(jù)進(jìn)行分析比較,,發(fā)現(xiàn)其變化規(guī)律表現(xiàn)為以平均數(shù)為中點(diǎn),,接近中點(diǎn)的頻數(shù)最多,離平均數(shù)遠(yuǎn)的頻數(shù)趨于減少,,形成中間高兩極低的正態(tài)理論分布,。 (2)引文篇數(shù)分布:即每篇研究論文平均占有的引文篇數(shù)的分布。它不僅反映了論文作者引用文獻(xiàn)的廣度和深度,而且還能說明引文與被引文的學(xué)科內(nèi)容之間的聯(lián)系強(qiáng)度,。 3.引文的集中與離散規(guī)律分析:引文分布的集中性與離散性是相對(duì)于一定的測(cè)度指標(biāo)而言的,。引文按來源期刊的分布,引文篇數(shù)的頻數(shù)以平均數(shù)為中心的分布,,引文按年度,、語種、文獻(xiàn)類型等的分布,,都表現(xiàn)出這種集中與離散的趨勢(shì),。 4.引文類型分析:科學(xué)研究中引用的文獻(xiàn)很廣,有期刊論文,、圖書和特種文獻(xiàn),。對(duì)被引文獻(xiàn)的類型進(jìn)行分析,將有利于確定文獻(xiàn)情報(bào)搜集的重點(diǎn),。 5.引文語種分析:引用文獻(xiàn)是由不同語種的文獻(xiàn)構(gòu)成的,。某一語種的文獻(xiàn)被引用量愈大,則說明該語種比較常用和重要,??疾旌头治鲆恼Z種的分布,對(duì)于人們有計(jì)劃地引進(jìn)外文文獻(xiàn),、譯文選題,、外語教育等,頗有參考價(jià)值,。 6.引文國(guó)別分析:對(duì)引文的國(guó)別分析,,特別是各國(guó)文獻(xiàn)互引情況的統(tǒng)計(jì)分析,可以探明各國(guó)互引文獻(xiàn)的狀況,,弄清國(guó)際文獻(xiàn)交流的數(shù)量和流向,。 引文分析法的特點(diǎn) 1.廣泛適用性;引文分析的素材是引文與被引文,,而引文現(xiàn)象又是普遍存在的,。以期刊論文為例,全世界范圍約有90%以上的科學(xué)論文附設(shè)了引用文獻(xiàn),,平均每 篇論文有引用文獻(xiàn)15篇,。我國(guó)目前88%左右的重要科學(xué)論文帶有引用文獻(xiàn),平均每篇中文科學(xué)論文有引用文獻(xiàn)8.9篇,,可以說,,凡是有引用文獻(xiàn)的地方,引文 分析方法就有用武之地,,所以,,引文分析方法具有廣泛適用性,。 2.簡(jiǎn)便易用性:由于引文分析不要求其它先決條件和輔助條件,不需要使用者具有十分專深的知識(shí),,研究的深度,、廣度可以由自己控制,所以一般的信息人員都可 以借助于這種方法,,完成一些有價(jià)值的研究課題,,解決一些工作中的實(shí)際問題??傊?,這種方法的使用限制極少,簡(jiǎn)便易用,,很值得在廣大的信息人員中普及推廣,。 3.功能特異性:由于引文分析方法具有廣泛適用性和簡(jiǎn)便易用性的特點(diǎn),通過一些不太復(fù)雜的統(tǒng)計(jì)和分析,,就可以確定核心期刊,、研究文獻(xiàn)老化規(guī)律、研究信息用戶的需求特點(diǎn),,甚至可以研究學(xué)科結(jié)構(gòu),、評(píng)價(jià)人才等,我們不能不為其功能而感嘆,。 引文分析法的局限 著者引用文獻(xiàn)是一個(gè)人為控制的思維和判斷過程,而作為其表現(xiàn)形式的引用文獻(xiàn),,僅僅是宏觀的,、表面的測(cè)度,受到許多限制因素的影響,。 (1)引文關(guān)系上假聯(lián)系的影響:引用文獻(xiàn)的原因多種多樣,,兩篇論文可能出于完全不同的原因或從不同的角度引用同一篇早期文獻(xiàn),一篇可能是引用其方法,,另一 篇可能是引用其結(jié)果,,那么這兩篇文獻(xiàn)在內(nèi)容上的聯(lián)系就有可能是虛假的。引文有些是發(fā)生在前言和篇名中,;有些是發(fā)生在正文中,;有些發(fā)生在結(jié)論或討論中。在這 些情況下,,作者對(duì)原著的引用內(nèi)容和程度是不相同的,。引文對(duì)原著的關(guān)系和重要性也各不相同,但在目前的引文分析中,,對(duì)它們都是同等看待,,不加區(qū)分的,。這樣也 容易造成成假關(guān)系。新刊的論文得不到大量引用,;小型期刊被引率往往低于大型期刊,;引而未用或用而未引的情況也時(shí)有發(fā)生。文獻(xiàn)引用中的這些現(xiàn)象都會(huì)影響引文 分析方法的應(yīng)用和效果,。 (2)文獻(xiàn)被引用并不完全等于重要:例如,,有些具有錯(cuò)誤觀點(diǎn)或結(jié)論的論文,后人出于批評(píng)商榷,,被引次數(shù)可能很多,。另一方面,被引次數(shù)較少的文獻(xiàn)也不能一概 認(rèn)為不重要,。它受到許多因素的限制,,如發(fā)表的時(shí)間、語種,、學(xué)科專業(yè)等等,。被引次數(shù)上的微小差別也不能完全說明質(zhì)量上的優(yōu)劣,它有很大的隨機(jī)性,,只有當(dāng)這一 差別很大時(shí),,才能說明問題。 (3)著者選用引文受到可獲得性的影響:索普(M.E.Soper)研究指出,,著者引用的文獻(xiàn),,大部分是個(gè)人收藏的文獻(xiàn);少部分是本部門和就近圖書館的資 料,,而其它城市或其它國(guó)家的文獻(xiàn)所占比例甚小,。這說明著者選用參考文獻(xiàn)以方便為準(zhǔn)則,以占有為前提,;同時(shí)還要受到著者語言能力,、文獻(xiàn)本身年齡和流通周期, 以及二次出版物報(bào)道的影響,。 (4)馬太效應(yīng)的影響:有的研究者認(rèn)為,,在文獻(xiàn)引用方面也存在著馬太效應(yīng)的影響。人們往往以“名著”,、“權(quán)威”作為選擇引文的標(biāo)準(zhǔn),,有的確是出于需要,也 有的則是為了裝飾門面,,抬高自己論文的身價(jià),。一種期刊因?yàn)榘l(fā)表名人的文章而為眾人所引用,以至引起連鎖反應(yīng),,結(jié)果其引文率很高,。這種馬太效應(yīng)的心理作用,, 掩蓋和影響著文獻(xiàn)引用的真實(shí)性。 引文分析法的測(cè)度指標(biāo) 一般來說,,對(duì)科學(xué)期刊進(jìn)行分析時(shí)常用的測(cè)度指標(biāo)有五種:即自引率,、被自引率、影響因子,、引證率與當(dāng)年指標(biāo),。在對(duì)專業(yè)和學(xué)科結(jié)構(gòu)進(jìn)行研究時(shí),除用引證率外,,還可用引文耦合和同被引等測(cè)度指標(biāo),。 1.自引率:在引用文獻(xiàn)的過程中,限于主體本身范圍內(nèi)的引用稱之為“自引”,。包括同一類學(xué)科文獻(xiàn)的自引,、同一期刊文獻(xiàn)的自引、同一著者文獻(xiàn)的自引,、同一機(jī) 構(gòu)文獻(xiàn)的自引,、同一種文獻(xiàn)的自引、同一時(shí)期文獻(xiàn)的自引,、同一地區(qū)文獻(xiàn)的自引,。自引率就是對(duì)主體本身范圍內(nèi)文獻(xiàn)引用的次數(shù)與主體引用的文獻(xiàn)總數(shù)的比值。 2.被自引率:這是被引用現(xiàn)象的一個(gè)測(cè)度,,被自引率就是主體文獻(xiàn)被自引的次數(shù)與主體被引用的總次數(shù)的比值,。它反映出被引用中有多少是被自己引用的。 3.影響因子:主要在研究科技期刊時(shí)使用,,等于期刊在規(guī)定時(shí)間內(nèi)(一般是兩年)論文被引量與可引論文總數(shù)之比,。 4.引證率:期刊引證率等于該刊中參考文獻(xiàn)量除以期刊載文量。這是衡量吸收文獻(xiàn)能力的一個(gè)相對(duì)指標(biāo),。 5.即時(shí)指標(biāo):這是測(cè)度期刊被引用速度的指標(biāo),它是期刊某年發(fā)表的論文當(dāng)年被引用的次數(shù),,除以該刊這一年所發(fā)表文章的總數(shù),,是衡量期刊重要性的一種依據(jù)。 6.引文耦合:當(dāng)兩篇文章同時(shí)引用一篇或多篇相同的文獻(xiàn)時(shí),,這種現(xiàn)象稱引文耦合,,這兩篇文獻(xiàn)就具有耦合關(guān)系。引文耦合的文獻(xiàn)之間總存在著這樣或那樣的聯(lián)系,,其聯(lián)系的程度稱為耦合強(qiáng)度,。 7.同被引:當(dāng)兩篇(多篇)論文同時(shí)被別的論文引用時(shí),則稱這兩篇論文具有“同被引”關(guān)系,,引用它們的論文的多少,,即同被引程度,,稱為同被引強(qiáng)度。 引文分析法的應(yīng)用領(lǐng)域 目前,,引文分析技術(shù)日趨完善,,應(yīng)用不斷擴(kuò)大,已發(fā)展成為文獻(xiàn)計(jì)量學(xué)的重要方法之一,。引文分析方法的應(yīng)用主要有以下幾個(gè)方面: 1.測(cè)定學(xué)科的影響和重要性:通過文獻(xiàn)引用頻率的分析研究可以測(cè)定某一學(xué)科的影響和某一國(guó)家某些學(xué)科的重要性,。 2.研究學(xué)科結(jié)構(gòu):通過引文聚類分析,特別是從引文間的網(wǎng)狀關(guān)系進(jìn)行研究,,能夠探明有關(guān)學(xué)科之間的親緣關(guān)系和結(jié)構(gòu),,劃定某學(xué)科的作者集體;分析推測(cè)學(xué)科間 的交叉,、滲透和衍生趨勢(shì),;還能對(duì)某一學(xué)科的產(chǎn)生背景、發(fā)展概貌,、突破性成就,、相互滲透和今后發(fā)展方向進(jìn)行分析,從而揭示科學(xué)的動(dòng)態(tài)結(jié)構(gòu)和某些發(fā)展規(guī)律,。 3.研究學(xué)科信息源分布:通過文獻(xiàn)間的相互引證關(guān)系,,分析某學(xué)科(或?qū)I(yè))文獻(xiàn)的參考文獻(xiàn)的來源和學(xué)科特性,不僅可以了解該學(xué)科與哪些學(xué)科有聯(lián)系,,而且還能探明其信息的來源及分布特征,,從而為制定本學(xué)科的信息管理方案和發(fā)展規(guī)劃提供依據(jù)。 4.確定核心期刊:引文分析方法是確定核心期刊的常用方法之一,。這種方法的主要特點(diǎn),,是從文獻(xiàn)被利用的角度來評(píng)價(jià)和選擇期刊的,比較客觀,。加菲爾德通過引 文分析,,研究了文獻(xiàn)的聚類規(guī)律。他將期刊按照期刊引用率的次序排列,,發(fā)現(xiàn)每門學(xué)科的文獻(xiàn)都包含有其它學(xué)科的核心文獻(xiàn),。這樣,所有學(xué)科的文獻(xiàn)加在一起就可構(gòu) 成一個(gè)整體的,、多學(xué)科的核心文獻(xiàn),,而刊載這些核心文獻(xiàn)的期刊不過1000種左右。利用期刊引文的這種集中性規(guī)律可以確定學(xué)科的核心期刊,。 5.研究文獻(xiàn)老化規(guī)律:目前,,有關(guān)文獻(xiàn)老化的研究一般是從文獻(xiàn)被利用角度出發(fā)的。D.普賴斯曾利用引文分析探討文獻(xiàn)的老化規(guī)律,。通過對(duì)“當(dāng)年指標(biāo)”和“期 刊平均引用率”的分析,,他認(rèn)為期刊論文是由半衰期絕然不同的兩大類文獻(xiàn)構(gòu)成的,,即檔案性文獻(xiàn)和有現(xiàn)時(shí)作用的文獻(xiàn)??茖W(xué)文獻(xiàn)之間引文關(guān)系的一種基本形式是引 文的時(shí)間序列,。對(duì)引文的年代分布曲線進(jìn)行分析,可以測(cè)定各學(xué)科期刊的“半衰期”和“最大引文年限”,,從而為制定文獻(xiàn)的最佳收藏年限,、對(duì)文獻(xiàn)利用進(jìn)行定量分 析提供依據(jù)。同時(shí),,一個(gè)學(xué)科的引文年代分布曲線與其老化曲線極為相似,。這有力地說明文獻(xiàn)引文分布反映了文獻(xiàn)老化的規(guī)律性。因此,,從文獻(xiàn)引用的角度研究文獻(xiàn) 老化規(guī)律是一種有效的途徑和方法,。 6.研究信息用戶的需求特點(diǎn):利用引文分析方法進(jìn)行信息用戶研究是一種重要途徑。根據(jù)科學(xué)文獻(xiàn)的引文可以研究用戶的信息需求特點(diǎn),。一般來說,,附在論文末尾 的被引用文獻(xiàn)是用戶(作者)所需要和利用的最有代表性的文獻(xiàn)。因此,,引文的特點(diǎn)可基本反映出用戶利用正式渠道獲得信息的主要特點(diǎn),,尤其是某信息中心對(duì)其所 服務(wù)的用戶所發(fā)表的論文的引文分析,更具有直接的指導(dǎo)意義,。通過對(duì)同一專業(yè)的用戶所發(fā)表的論文的大量引文統(tǒng)計(jì),,可以獲得與信息需求有關(guān)的許多指標(biāo),如引文 數(shù)量,、引文的文獻(xiàn)類型,、引文的語種分布、引文的時(shí)間分布,、引文出處等,。 7.評(píng)價(jià)人才:在人才評(píng)價(jià)方面,常采用引文分析方法,。這是因?yàn)槟持叩恼撐谋粍e人引用的程度可以是衡量該論文學(xué)術(shù)價(jià)值和影響的一種測(cè)度,,同時(shí),也從科研成 果被利用的角度反映了該著者在本學(xué)科領(lǐng)域內(nèi)的影響和地位,。因此,引文數(shù)據(jù)為人才評(píng)價(jià)提供了定量依據(jù),。從對(duì)歷年諾貝爾獎(jiǎng)金獲得者的論文被引用情況的統(tǒng)計(jì)來 看,,物理學(xué)、化學(xué),、醫(yī)學(xué)領(lǐng)域中諾貝爾獎(jiǎng)金獲得者中,,其論文被引次數(shù)最高者(L.D.Landan)為1888次,;最低的也有79次(J· H· D· Jensen);只有六名低于 200次,??梢姡@些科學(xué)界的精英的論文的引用次數(shù)是很高的,。 |
|