來源:學(xué)術(shù)苑(ID:Academic_Centre),浙江社會科學(xué)2008年3月內(nèi)容提要:本文討論了因果關(guān)系的定義以及社會科學(xué)中如何分析因果關(guān)系及其必要性,介紹了社會科學(xué)中分析因果關(guān)系的幾種主要的定性、定量分析方法, 并且從理論上討論了在使用這些方法時所需要注意的幾個值得關(guān)注的理論問題,。
關(guān)鍵詞:社會科學(xué) 因果關(guān)系 定性分析 定量分析社會科學(xué)研究的主要任務(wù)和使命在于面對紛繁蕪雜的現(xiàn)象世界, 探索,、厘清事件的真相, 并尋找、鑒別隱藏在事件背后并導(dǎo)致現(xiàn)象發(fā)生的原因,。其中, 尋求真相受到各種因素的影響, 且很多因素并不在社會科學(xué)研究者的掌握范圍之內(nèi),。但是,識別、鑒定現(xiàn)象背后的原因, 卻是社會科學(xué)學(xué)者責(zé)無旁貸的任務(wù), 且從復(fù)雜的現(xiàn)象當(dāng)中尋找出其原因, 并用簡潔,、嚴(yán)謹(jǐn),、合適的語言表達(dá)出來, 也是判斷他們工作價值的一個重要標(biāo)準(zhǔn),。不僅如此, 找出現(xiàn)象之間的因果關(guān)系還具有一定的工具價值,因為一旦發(fā)現(xiàn)了真正的原因, 往往意味著我們可以從干預(yù)、改變原因入手從而導(dǎo)致結(jié)果的變化, 從而使干預(yù),、改造社會環(huán)境成為可能,。自改革開放以來, 社會科學(xué)研究中一切以政治正確為標(biāo)準(zhǔn), 以意識形態(tài)為唯一指導(dǎo)的壟斷局面不斷被反思且益發(fā)顯得不合時宜。與此同時,國外先進(jìn)的研究方法和理念被不斷介紹到國內(nèi),從而推動了我國社會科學(xué)的分工, 使社會科學(xué)的發(fā)展有了一個質(zhì)的飛躍,。例如信息不對稱理論,、博弈論等理論, 以及大量新的統(tǒng)計、計量工具, 不僅在國內(nèi)經(jīng)濟(jì)學(xué)研究中被廣泛運(yùn)用, 對諸如政治學(xué),、社會學(xué),、歷史學(xué)、法學(xué)等其他各種學(xué)科進(jìn)步的促進(jìn)作用也是顯而易見的,。不過, 盡管當(dāng)前我國社會科學(xué)研究進(jìn)步明顯,卻鮮有人認(rèn)真歸納總結(jié)如何分析現(xiàn)象之間的因果關(guān)系,。許多研究者的工作往往僅停留在對現(xiàn)象之間關(guān)系的簡單描述和統(tǒng)計, 卻忽略了所研究現(xiàn)象之間因果關(guān)系的性質(zhì), 例如把簡單的相關(guān)關(guān)系直接等同于因果關(guān)系, 把虛假關(guān)系(SpuriousRelation)當(dāng)作真實關(guān)系, 等等。另外, 由于錯誤理解因果關(guān)系的性質(zhì), 研究者還容易在模型設(shè)定,、樣本選擇等方面犯下致命錯誤, 從而使自己研究結(jié)果完全喪失有效性(Validity),。因此,正確地分析因果關(guān)系, 就構(gòu)成提高我國社會科學(xué)學(xué)者研究質(zhì)量的不可或缺的一環(huán)。而本文的目的, 則是簡明扼要地介紹一下目前國外學(xué)術(shù)界在分析因果關(guān)系方面所取得的進(jìn)展和方法, 以引起國內(nèi)學(xué)術(shù)界的注意, 并在這方面的工作起到拋磚引玉的作用,。①在文章的以下部分, 筆者將首先介紹因果關(guān)系的種類, 其次介紹幾種分析因果關(guān)系的常用方法, 最后討論一下在分析因果關(guān)系時會經(jīng)常碰到的一些問題以及相應(yīng)的注意事項,。一般而言, 當(dāng)我們談到因果關(guān)系的時候, 實際上是把不同變量放在一個時間維度里進(jìn)行考察的,。例如我們認(rèn)為X(因)導(dǎo)致了Y(果), 那么這包含兩層意思:一是X的發(fā)生(變化)在時間上是先于Y的發(fā)生(變化)的, 二是由于X的發(fā)生(變化), 從而導(dǎo)致Y的發(fā)生(變化),。第一層意思相對明顯, 第二層意思卻相對復(fù)雜。例如, 如果說X導(dǎo)致Y, 但同時Z導(dǎo)致X, 那么如何看待Z和Y之間的關(guān)系? 如果除X導(dǎo)致Y, 而且A亦導(dǎo)致Y, 那么這三者之間又如何界定關(guān)系,。再如, 如果說在某環(huán)境下X導(dǎo)致Y, 那么是否意味著在另一個環(huán)境下我們會重復(fù)看到X導(dǎo)致Y? 反過來說, 如果X導(dǎo)致Y, 那么是否我們消除X的影響, 就可以避免Y的出現(xiàn)(發(fā)生)? 等等。要對這些問題予以解答, 我們需要對因果關(guān)系的種類進(jìn)行分別,。 必要/充分原因有時也叫必要/充分條件,。如果我們對干預(yù)現(xiàn)象的重復(fù)性發(fā)生(包括重復(fù)性促使或阻止、加快或減緩)感興趣, 那么就有必要搞清楚什么是必要原因和充分原因,。所謂必要原因, 是指現(xiàn)象Y的發(fā)生(變化)一定以現(xiàn)象X的發(fā)生(變化)為前提, 因此X被認(rèn)為是Y的必要原因,。換言之, 如果X不存在, 那么Y必定不會存在。例如, 氧元素的存在是燃燒的必要條件, 也就是說, 一旦不存在氧, 也就不存在燃燒,。再看一句我們都熟悉的政治語言:“沒有共產(chǎn)黨就沒有新中國” , 它實際上也陳述的是“共產(chǎn)黨”是“新中國”的必要條件, 因而“沒有”共產(chǎn)黨就“沒有”新中國,。必要原因的特點(diǎn)是我們能夠從一個現(xiàn)象(果)的存在確定性地倒推回另一個現(xiàn)象(因)的存在。例如, 如果我們能夠知道取得博士學(xué)位是獲得教授職稱的必要條件, 那么一旦我們觀察到某人獲得了教授職稱, 那么就肯定可以判斷他在此之前獲得了博士學(xué)位,。同樣地, 如果貨幣過度發(fā)行是通貨膨脹的必要條件, 那么一旦我們發(fā)現(xiàn)出現(xiàn)通貨膨脹現(xiàn)象, 那么就肯定可以判斷貨幣發(fā)行已經(jīng)過量了, 等等,。如果我們的目的是阻止某些事件發(fā)生的話, 那么必要原因則提供了一個有價值的思路:即阻止必要原因的發(fā)生。以貨幣發(fā)行與通貨膨脹的關(guān)系為例, 如果我們不想看到通貨膨脹的發(fā)生, 那么根據(jù)已知的必要原因, 我們只需要把貨幣發(fā)行量控制住就可以達(dá)到目的了,。所謂充分原因, 是指現(xiàn)象X的發(fā)生(變化)一定會導(dǎo)致現(xiàn)象Y的發(fā)生(變化),。例如在一定大氣壓條件下, 氣溫下降到零攝氏度, 水一定會變成冰, 因此零攝氏度以下的溫度是水變?yōu)楸某浞衷?。而具有?qiáng)烈的公民責(zé)任感的公民在選舉時必定會到投票站去投票, 因此強(qiáng)烈的公民責(zé)任感是公民外出投票的充分原因, 等等。需要注意到的是, 對于一個現(xiàn)象Y, 很可能有不同的充分原因(X1 ,、X2 ,、X3 ..)的存在導(dǎo)致這一現(xiàn)象的發(fā)生。例如心肌梗死,、遭受致命車禍,、中毒, 等等, 均可看作是導(dǎo)致一個人死亡的充分原因。貧窮,、性別歧視,、厭學(xué), 等等, 均可看作是一個小女孩從學(xué)校退學(xué)的充分原因, 等等。另外, 對于社會現(xiàn)象而言, 盡管有些原因可以既構(gòu)成充分條件, 也構(gòu)成必要條件(例如貨幣發(fā)行過量之于通貨膨脹), 但在許多情況下, 充分原因并不構(gòu)成必要原因, 反之亦然,。例如, 我們所提到的小女孩退學(xué)的例子, 所有的原因都是充分原因, 但都不是必要原因,。因此, 即使我們看到Y(jié)的存在并且知道哪些原因構(gòu)成其發(fā)生的充分原因, 但除非我們知道足夠多的細(xì)節(jié)信息, 我們無法像分析充分原因那樣從結(jié)果直接倒推回原因。必要/充分原因被看作是確定性的因果解釋(DeterministicExplanation,orDeterministism), 因為要么原因是確定的, 要么結(jié)果是確定的,。這種解釋和事件發(fā)生的概率可能性(Probabilism)相對立:事件的發(fā)生是完全非隨機(jī)性的結(jié)果, 如果方法得當(dāng), 那么世界幾乎是可以完全預(yù)測的,。但實際上, 有大量的因果關(guān)系并不是完全按照確定性的方式表現(xiàn)出來, 而是以一種非確定性的, 或類似回歸模型的方式表現(xiàn)出來的。 相對于確定性的必要/充分原因, 非確定性原因通過兩種方式表現(xiàn)出來:一種是解釋變量除了可以被看作是完全的必要/充分原因外, 也可以體現(xiàn)為在多大程度上被看作是近似必要/充分原因,。例如, 從完全性的必要/充分原因(Alwaysnecessary/sufficient)到近似的必要/充分原因(Usuallynecessary/sufficient), TomasErtman(1997)是一個較好的例子,。在其名著《利維坦的誕生:中世紀(jì)和早期現(xiàn)代歐洲的國家構(gòu)建與政治體制》(TheBirthofLeviathan:BuildingStatesandRegimesinMedievalandEarlyModernEurope)中, Ertman試圖解釋為什么在中世紀(jì)結(jié)束前后歐洲國家會形成不同的國家體制。他首先比較了以前的各種理論, 發(fā)現(xiàn)如果用14個歐洲國家的例子來驗證這些理論, 那么在這14個案例中, 至少有4個案例是和這些理論的預(yù)計相矛盾的,。而他自己所提出的理論解釋則和14個案例中的12個相吻合,只是在解釋瑞典和丹麥時發(fā)生了錯誤,。因為對這兩個案例的解釋失敗, Ertman無法將他的解釋變量看作是完全的充分原因, 而只能將其看作是近似的充分原因, 但比他所比較的其他理論更接近于充分原因(Mahoney2003)。另一種是各個解釋變量都可以對結(jié)果(被解釋變量)具有一定的作用, 但都無法被獨(dú)立看作是完全的充分或必要條件,。例如, 良好的地理條件,、較高的儲蓄率、較高的人力資本, 等等, 都對經(jīng)濟(jì)增長具有作用, 但都無法被看作是經(jīng)濟(jì)增長的完全的充分或必要條件,。而醉酒駕駛和車禍之間的關(guān)系(Liberson1991)也與此類似,。在回歸分析中, 這種關(guān)系通常被表述成:在其他條件不變的條件下, ΔX的變化導(dǎo)致ΔY發(fā)生的概率發(fā)生的變化。 INUS為英文“Each is insufficient [IbutnecessaryN] partofa condition which is it selfunnecessary [U]but exclusively sufficient[ S] for the effect”的縮寫, 意為對一組可以用來解釋結(jié)果的解釋原因而言, 所有這些因素可以劃歸為若干子原因組, 其中每一個子原因都可以構(gòu)成導(dǎo)致結(jié)果的充分原因, 而構(gòu)成這些子原因的因素本身, 對其所在的子原因而言都可以看作是構(gòu)成它的必要而不是充分原因,。圖1給出了某地區(qū)公共投資質(zhì)量下降的原因構(gòu)成圖, 可以看作是一個典型的INUS例子,。
在圖1 中, A1 和A2 的組合, 以及B1和B2的組合, 分別構(gòu)成結(jié)果(C)的(非唯一)充分原因。而A1和A2則分別是其自身組合的必要而非充分原因, B1和B2則分別是其自身組合的必要而非充分原因,。因此, INUS實際上可以看作是一個多重路徑的因果關(guān)系, 一個結(jié)果可以通過不同的原因產(chǎn)生, 而這些不同的原因又是各個因素的組合,。這種關(guān)系可以通過如下語言表示:Y=(X1*X2 * …)+(Z1 *Z2 *… ), 其中*和+分別表示“并且”與“或者”的邏輯運(yùn)算符號。NUS可以使我們對確定性原因(充分原因)和非確定性的原因進(jìn)行進(jìn)一步思考,。從本質(zhì)上講, 非確定性原因之所以存在,是因為人類認(rèn)知能力的有限性和信息的不充分所致,。在認(rèn)知能力和信息充分的條件下, 我們完全可以識別確定性原因。換言之, 給定考察對象范圍, 即使一個單個的因素?zé)o法構(gòu)成確定性的必要/充分原因, 但它和其它因素的組合完全可以構(gòu)成導(dǎo)致結(jié)果的充分原因,。比如, 在Liberson(1992)醉酒駕駛和車禍的例子中, 醉酒駕駛并不能構(gòu)成車禍的充分原因, 但如果是在夜間行駛且亮度較低的情況下, 三者的結(jié)合卻成為出車禍的充分條件,。同樣, 實行固定匯率制度并不是一個國家是否發(fā)生金融危機(jī)的充原因, 但如果一個實行固定匯率制度的經(jīng)濟(jì)發(fā)生較嚴(yán)重的通貨膨脹(或貿(mào)易赤字), 且不存在資本控制的條件下, 那么這三者的組合卻是發(fā)生金融危機(jī)的充分原因,。簡單地說, 考慮INUS的存在, 隨著我們知識的積累, 認(rèn)知能力的上升, 以及對細(xì)節(jié)信息掌握程度的提高, 我們完全有可能找到導(dǎo)致Y發(fā)生的充分原因。4.直接(Proximate)和間接(Remote)原因 直接原因是不經(jīng)過其他因素而直接會導(dǎo)致結(jié)果發(fā)生的原因, ②而間接原因是直接原因的原因,。換言之, 如果X是Y的直接原因, 而Z是導(dǎo)致X的原因, 那么Z就是Y的間接原因,。例如, 對某產(chǎn)業(yè)投資的決策而言, 對該產(chǎn)業(yè)增長前景的信心程度是決策的直接原因, 而該國的法律對產(chǎn)權(quán)的保護(hù)則是間接原因, 因為它通過影響投資者對該產(chǎn)業(yè)的信心來影響投資決策。間接原因一般在分析歷史因素時會起到很大的作用,。例如在歷史學(xué)上有個有趣的命題, 即中國長城的修建導(dǎo)致羅馬帝國的衰亡,。其因果鏈條如下:長城的存在阻擋了野蠻人向東方挺進(jìn), 迫使他們向西方發(fā)展。這些向西洶涌而去的野蠻人最終沖破了羅馬帝國的防御, 導(dǎo)致后者衰亡,。這里,來自野蠻人的進(jìn)攻是羅馬帝國崩潰的直接原因,中國長城的修建則是間接原因,。Acemoglu等人(Acemogluetal2001 2002)提供了另一個直接和間接原因的例子。他們的研究指出, 前歐洲殖民地國家戰(zhàn)后的經(jīng)濟(jì)增長績效取決于他們的制度質(zhì)量, 而制度質(zhì)量又取決于1492年當(dāng)歐洲殖民者開始到達(dá)殖民地時針對殖民地所作出的制度安排,。這些殖民制度在戰(zhàn)后殖民地獲得獨(dú)立后因為路徑依賴的關(guān)系而繼續(xù)發(fā)揮影響, 從而影響到現(xiàn)時制度的質(zhì)量, 并最終影響經(jīng)濟(jì)增長,。在多大程度上應(yīng)該找尋間接原因取決于所研究問題的性質(zhì)以及間接原因?qū)ψ罱K結(jié)果的作用。比如保險公司調(diào)查一棟辦公樓起火的原因, 直接原因是客戶蓄謀放火謀取保金, 間接原因是因為某處農(nóng)作物收成大幅下降, 導(dǎo)致其期貨投資虧損,。這里盡管間接原因作用明顯, 但保險公司是不會對提高農(nóng)作物收成產(chǎn)生任何興趣的,。而對于主管一國經(jīng)濟(jì)的決策者而言, 資本和勞動投入的增長是經(jīng)濟(jì)增長的直接原因, 法治環(huán)境的改善、自然環(huán)境的提升,、政府職業(yè)培訓(xùn)投資力度的加大, 等等可以看作是間接原因,。這里決策者不僅關(guān)心間接原因, 而且會努力找出所有有影響的間接原因。另外, 弄清楚直接和間接原因的關(guān)系在一定條件下對定量分析中的模型構(gòu)建也是非常重要的,。例如在回歸分析中經(jīng)常使用的工具變量法(InstrumentMethod), 實際上就是通過尋找滿足一定條件的間接原因作為直接原因的工具變量,以此來判斷因果關(guān)系和衡量其大小,。并且, 這種間接原因作用于直接原因的路徑一定需要滿足唯一性(即只能通過直接原因這一條路徑影響結(jié)果), 否則工具變量法將不再有效。 除了以上所介紹的單向因果關(guān)系外, 現(xiàn)實中還存在大量的雙向因果關(guān)系,。在一定時期,、條件下, X是Y的原因。隨著時間,、條件的改變, Y成為X的原因,。例如經(jīng)濟(jì)政策和經(jīng)濟(jì)危機(jī)的關(guān)系、經(jīng)濟(jì)增長和收入分配的關(guān)系,、工資上升和物價上漲的關(guān)系, 等等。不過這些雙向因果關(guān)系, 在很大程度上是建立在多樣本基礎(chǔ)之上, 是對連續(xù)性,、重復(fù)性現(xiàn)象的一般化,。如果把注意力集中到單獨(dú)的事件, 那么單向的因果關(guān)系會更有助于我們對現(xiàn)象關(guān)系的理解。分析因果關(guān)系的方法有很多, 按其所使用的分析工具, 一般可以分為兩類:定量和定性方法,。以下我們將主要介紹幾種在社會科學(xué)研究中被廣泛使用的定量和定性方法。1.定量方法1 -相關(guān)分析或回歸分析法(RegressionAnalysis,RA)
在RA當(dāng)中, 研究者一般在對數(shù)據(jù)作出一定假設(shè)的前提下(Gujarati2003), 將因變量(Y)對自變量(X1 ,、X2 … )進(jìn)行回歸, 從而得到他們之間的數(shù)量關(guān)系,。一般采取如下形式:Y=α+β1 gX1 +β2 gX2 +… +βkgXk +ξ (1)根據(jù)這種方法, 研究者可以在多樣本觀測的基礎(chǔ)上得到自變量(解釋變量)Xi對因變量(被解釋變量)Y的平均影響,。換言之, 對單個樣本觀測(i)而言, 研究者定義因果效應(yīng)采取如下形式:其中, 上標(biāo)T表示刺激(Treatment), C表示控制(Control)。方程(2)說明單個觀測到因果效應(yīng)表現(xiàn)為被解釋變量在解釋變量變化前后的差異這被稱作是觀測i“被實現(xiàn)的因果效應(yīng)(RealizedCausalEffect)”(King, Keohane, andVerba1994,78 -9)或者“單觀測因果效應(yīng)(IndividualCausalEffect)”(David2000),。在實際中, 很多情況下我們常常只能觀測到樣本接受刺激前或者刺激后的實際值, 因此這種方法又被看作是“反事實的(Counterfactual)”分析方法,。在多樣本觀測到情況下, 因果效應(yīng)不再表現(xiàn)為單觀測因果效應(yīng), 而是表現(xiàn)為不同觀測之間單觀測因果效應(yīng)的平均水平, 這一效應(yīng)通過方程(3)表現(xiàn)出來:(3)又被稱為平均因果效應(yīng)(AverageCausalEffect, orMeanCausalEffect), 其中μ表示眾樣本接受刺激和控制狀態(tài)下的平均效應(yīng)。這樣, 在單個觀察條件下無法被直接觀測到的單觀測因果效應(yīng)就被轉(zhuǎn)換為多觀測條件下的平均因果效應(yīng),。可以看出, 回歸分析法是通過衡量變量Y在X變量接受刺激和接受控制之間的狀態(tài)變化來衡量變量X所導(dǎo)致的Y的變化, 因而這種方法也被看作是“因果關(guān)系效應(yīng)法(Effect-of-Causal)” ,。而這種衡量平均效應(yīng)的方法并不適合用來直接檢驗確定性的必要/充分原因。在回歸方法下, X對Y的因果關(guān)系一般表示為:在其他條件不變的情況下, X的一定變化所導(dǎo)致的Y的相應(yīng)變化,。2.定量分析法2 -實驗分析法(Experimental Design, or ExperimentalAnalysis) 實驗分析法是在上世紀(jì)60,、70年代開始逐步被應(yīng)用在社會科學(xué)研究中的, 近年來更是被廣泛應(yīng)用到經(jīng)濟(jì)學(xué)、政治學(xué)和心理學(xué)等領(lǐng)域,。在公共物品投資,、政治參與、收入分配,、激勵機(jī)制,、行為主體的心理感受、認(rèn)知能力對行為的影響等各個方面, 實驗方法所帶來的沖擊和效果都是非常顯著的,。實驗方法的基本思路是, 通過實驗設(shè)計者直接控制,、操縱實驗參與者所面臨的約束和激勵條件(解釋變量X), 并觀察他們在接受刺激前、后的狀態(tài)(解釋變量Y)的變化, 從而得到X對Y的因果效應(yīng),。由于在實驗中, X的變化是完全外生的, 因而回歸分析中所經(jīng)常困擾研究者的內(nèi)生性問題(EndogeneityProblem)在很大程度上得到了控制,。研究者指出, 一個高質(zhì)量的實驗設(shè)計需要考慮實驗的內(nèi)部(InternalValidity)有效性和外部有效性(ExternalValidity)問題(CampbellandStanley 1966)。所謂內(nèi)部有效性問題, 主要指因為實驗設(shè)計本身存在的貽誤, 導(dǎo)致實驗結(jié)論的有效性受到懷疑, 這主要包括以下幾個方面:(1)歷史問題(History),。如果實驗接受刺激前和接受刺激后這兩種狀態(tài)之間相隔超出一定時間(例如數(shù)天,、數(shù)月, 等等), 那么即使兩種狀態(tài)出現(xiàn)差異, 這種差異也不一定能夠歸結(jié)為因為接受刺激所帶來的變化, 而有可能是在此期間所發(fā)生的其他事件導(dǎo)致接受刺激前后狀態(tài)出現(xiàn)變化。比如研究者想觀察實驗接受者觀看黑人文化紀(jì)錄片對種族政策態(tài)度的作用, 但在播放紀(jì)錄片期間(比如持續(xù)了一周), 一些反映黑人受歧視的新聞報道正在電視里頻繁播出且實驗接受者觀看了這些新聞, 那么這幾乎可以肯定會對實驗接受者的態(tài)度產(chǎn)生影響,。(2)成長問題(Maturation),。這一問題和實驗過程中, 時間流逝所自然帶來的問題相關(guān)。比如他們因為實驗時間拖得較長而顯得不耐煩,、疲倦,甚至因為時間足夠長而對問題突然有了新的看法, 那么實驗中所觀測到的差異也不能簡單地歸結(jié)為接受刺激所帶來的變化,。和歷史問題相比,成長問題看重的是一個連續(xù)的過程, 而前者則注意單獨(dú)的事件的影響。(3)測試問題(Testing),。一方面, 隨著實驗接受者對實驗程序和規(guī)則的熟悉, 因此實驗的次數(shù)越多, 他們對接受刺激的刺激會越來越熟練,。另外, 聰明的實驗接受者可能在實驗中猜測出實驗設(shè)計者的意圖, 因而會有意以一種使實驗設(shè)計者滿意的方式進(jìn)行反應(yīng)。這些因素會導(dǎo)致因果關(guān)系的推導(dǎo)出現(xiàn)偏差,。(4)工具問題(Instrumentation),。如果接受刺激前后測量狀態(tài)的方法或標(biāo)準(zhǔn)出現(xiàn)變化, 而這種變化和實驗本身無關(guān), 那么接受狀態(tài)刺激前后的差異就不能直接用來進(jìn)行因果關(guān)系判斷。(5)回歸問題(Regression),。如果接受刺激極端狀態(tài)本身就是一種極端情況, 那么無論是否接受刺激, 其狀態(tài)都會向正常方向回歸,。同樣地,這也會給因果關(guān)系的判斷帶來偏差,。和內(nèi)部有效性不同, 外部有效性問題和實驗本身用來衡量因果效應(yīng)的設(shè)計無關(guān), 但會影響從實驗中所得出結(jié)論的一般化(Generalizability), 即實驗結(jié)論的有效范圍是有限的, 很可能只局限于實驗所覆蓋的樣本之內(nèi)。有些影響內(nèi)部有效性的問題, 例如從成長問題可以看出, 適用于少年人的實驗結(jié)論可能無法推廣到成年人,。從邏輯上說,外部有效性要求從現(xiàn)有樣本中得到的結(jié)論被外推到其他樣本中去, 而后者并不一定和實驗樣本具有同樣的特性,。這樣, 外部有效性問題可以被減弱, 但永遠(yuǎn)無法徹底解決。為了盡可能地增加實驗設(shè)計的外部和內(nèi)部有效性, 研究者指出在一個較理想的實驗中, 刺激(Treatment)的實施需要是隨機(jī)的, 和Y的初始狀態(tài)不存在相關(guān)關(guān)系,。實驗接受者的接受刺激前后的狀態(tài)應(yīng)該是互不相關(guān)的,。樣本的選取應(yīng)該遵循隨機(jī)原則, 且樣本在對比組(TreatmentGroup)和控制組(ControlGroup)之間的分配也應(yīng)該是隨機(jī)的。③圖2給出了一個在實驗中經(jīng)常被用到的設(shè)計程序, 它簡單地說明了在設(shè)置好了對比組和控制組織后, 實驗是怎樣被貫徹的,。其中R代表對樣本在實驗各組之間的隨機(jī)配置;X代表對實驗設(shè)計者所施加的刺激措施, 它代表了解釋變量X, 它對實驗發(fā)生刺激前后狀態(tài)差異的作用正是實驗設(shè)計者所感興趣的;Os代表實驗所處的狀態(tài), 它可以由某種方式或指標(biāo)衡量出來,。每一行從左到右表示過程或時間順序, 其中處于X左邊的被看作是接受刺激前(Pretest)時期, 處于X右邊的被看作是接受刺激后(Posttest)時期。通過對比組接受刺激前后狀態(tài)的差異的對比, 以及這一差異和控制組相應(yīng)時期狀態(tài)差異之間的對比, 實驗者可以對因果關(guān)系及其效應(yīng)進(jìn)行判斷,。不過, 社會科學(xué)的實驗并不全部是在實驗室里面完成的,。根據(jù)實驗發(fā)生的條件、環(huán)境和作用對象等實驗構(gòu)成因素的不同, 以下兩類實驗也是社會科學(xué)研究者經(jīng)常使用的方法:自然實驗(NaturalExperiment)和實地實驗(FieldExperiment),。前者是指那些具有一切實驗室實驗特征的一整套過程, 但其中的控制組和對比組, 以及刺激的發(fā)生, 都是在完全的自然環(huán)境中形成, 而不是人為實驗設(shè)計的結(jié)果,。例如二戰(zhàn)后南北朝鮮的形成及其經(jīng)濟(jì)發(fā)展實踐被經(jīng)濟(jì)學(xué)家看成是一個對比經(jīng)濟(jì)制度績效的自然實驗。二戰(zhàn)結(jié)束后, 南北雙方在美蘇的支持下各自選擇了迥然不同的經(jīng)濟(jì)體制,。前者保留了市場機(jī)制實行市場經(jīng)濟(jì), 而后者則仿效斯大林模式實行計劃經(jīng)濟(jì),。而在此之前, 南北雙方享有相同的文化和傳統(tǒng), 地理位置和環(huán)境、自然資源稟賦,。實際上, 僅從工業(yè)化水平上來看, 北朝鮮還略占優(yōu)勢, 因為在日本殖民統(tǒng)治時期, 大部分工廠都建立在北方而不是南方,。這樣一來, 50年前的領(lǐng)土分離, 南北雙方選擇不同的制度就為判斷制度如何影響其后經(jīng)濟(jì)發(fā)展的績效提供了一個所謂實地實驗, 是指在自然環(huán)境中(而不是實驗室里)進(jìn)行貫徹實驗設(shè)計, 實驗對象盡量從實際社會中選取,、實驗所涉及的一切手段和刺激也盡量滿足和實際相符合的原則,。因為田野實驗和實際環(huán)境結(jié)合較為緊密, 因而該方法被認(rèn)為是更好地解決了實驗外部有效性的問題。另外, 即使從數(shù)據(jù)質(zhì)量上講, 實地實驗也存在一些優(yōu)點(diǎn),。比如傳統(tǒng)的實驗室試驗里, 參加對象主要是大學(xué)里的學(xué)生,。他們的人口統(tǒng)計特征(Demographic Characteristics), 包括年齡、教育背景, 等等均受到很大限制,。如果是實地實驗, 由于樣本從當(dāng)?shù)厝丝谥须S機(jī)抽選, 則人口統(tǒng)計特征的限制就被大大緩解了,。這意味著樣本的差異性得到了提高, 對數(shù)據(jù)的統(tǒng)計分析和結(jié)果在更大范圍內(nèi)的適用性都有很大的好處。不過, 也有研究者指出和原始意義上的實驗室實驗相比, 兩者之間的區(qū)別只是程度上的, 并不存在明顯的優(yōu)劣之分(Harrisonand List2004),。3.定性方法1———米爾分析法(Mill' sMethods) 米爾分析法被廣泛用來分析在小樣本條件下確定性的必要/充分原因是否存在,。這一方法主要包括: (1)一致分析法(Method ofAgreement,MOA) MOA可以用來確定地排除那些不構(gòu)成必要原因的因素。MOA的核心含義用表1 可以直觀簡潔地表示,。其中第二列中的字母分別代表潛在的解釋變量, 第三列代表被解釋變量的發(fā)生,。在第一行中, A,、B,、C的事前存在和現(xiàn)象S的隨后發(fā)生聯(lián)系在一起,。在第二行中, A、E,、F的事前存在和現(xiàn)象S的隨后發(fā)生聯(lián)系在一起,。在第三行中, A、H,、G的事前
存在和現(xiàn)象S的隨后發(fā)生聯(lián)系在一起,。A的存在總是和S的發(fā)生相聯(lián)系, 而B、C,、E,、F、H,、G消失則不影響S的發(fā)生,。因此我們可以認(rèn)為A是S的必要原因(不過這一結(jié)論卻有可能因為新案例的發(fā)現(xiàn)而改變), 而B、C,、E,、F、H,、是S的必要原因的可能性則可以被確定排除,。(2)差異分析法(MethodofDifference, MOD)
MOD可以用來確定地排除那些不構(gòu)成充分原因的因素。MOD的核心含義用表2可以直觀簡潔地表示,。
在第一行中, A,、B、C,、D的事前存在和現(xiàn)象S的隨后發(fā)生聯(lián)系在一起,。在第二行中, B、C,、D的事前存在以及A的消失和現(xiàn)象S的隨后消失聯(lián)系在一起,。因此我們可以認(rèn)為A是S發(fā)生的充分原因(不過這一結(jié)論卻有可能因為新案例的發(fā)現(xiàn)而改變), 而B、C,、D是S的充分原因的可能性則可以被確定排除,。在MOA和MOD方法的基礎(chǔ)上, 米爾分析法還有很多變體, 例如米爾差異—一致聯(lián)合法, 殘差法、協(xié)同變化法等等,。米爾分析法不僅可以用來分析單個變量是否構(gòu)成必要/充分原因, 還可以用來分析多重路徑的因果關(guān)系, 例如INUS原因是否存在,。例如考察如下導(dǎo)致一所房屋發(fā)生火災(zāi)的INUS原因(圖3): 圖3表明, A和B的組合構(gòu)成F(火災(zāi))發(fā)生的充分原因, C和D的組合同樣構(gòu)成F發(fā)生的另一個充分原因。表3給出了利用米爾差異—一致聯(lián)合法來反映這種關(guān)系:
從表3可以看出, A,、B,、C、D中沒有任何一個單獨(dú)因素構(gòu)成現(xiàn)象F發(fā)生的必要或充分原因。不過, A和B的組合, 以及C和D的組合構(gòu)成F發(fā)生的INUS原因,。4.定性分析法2———過程追蹤法(ProcessTracing) 過程追蹤法一般被用于對一個或幾個案例進(jìn)行因果分析,。但這種分析不是對某一試點(diǎn)特殊狀態(tài)的分析, 而是對一個連續(xù)性過程進(jìn)行解剖, 試圖通過對歷史發(fā)展軌跡前后順序的解讀來找出因果關(guān)系。不僅如此, 這一方法還試圖明確因果作用機(jī)制是怎樣具體運(yùn)作的, 換言之, 它希望回答X究竟通過什么樣的具體作用方式和渠道導(dǎo)致了Y(X※Z※Y),。比如, 一種假說認(rèn)為資本主義的發(fā)展會導(dǎo)致民主制度最終出現(xiàn),。其作用機(jī)制為資本主義發(fā)展會壯大工人階級以及中產(chǎn)階級的力量,而工人階級是堅決擁護(hù)民主的力量。資本主義的發(fā)展還會削弱大土地?fù)碛姓叩牧α? 而這一階級是堅決反對民主的,。如果工人階級在斗爭中學(xué)會如何組織自己, 并尋找到自己的盟友與之聯(lián)合, 那么民主就會出現(xiàn),。這樣, 資本主義的發(fā)展會導(dǎo)致?lián)碜o(hù)和反對民主的兩大力量之間的相對強(qiáng)弱, 從而為民主制度的建立創(chuàng)造必要條件。如果用過程分析法驗證這一假說, 就應(yīng)該從民主制度建立之前, 工業(yè)化伊始之時開始展開分析,。觀察是否資本主義的發(fā)展導(dǎo)致了工人階級力量的壯大, 是否工人階級自身的斗爭并與其他階級之間的聯(lián)合迫使大土地所有者階級放棄政治壟斷, 從而實現(xiàn)民主,。因此, 這一過程實際上說明資本主義(X)是通過階級力量相對變化(Z)這一機(jī)制起作用的。而對于那些沒有出現(xiàn)階級力量相對變化的案例,資本主義的發(fā)展不會導(dǎo)致民主制度的建立(Y),。任何一個環(huán)節(jié)(X※Z或Z※ Y)如果沒有被歷史過程所證明, 都會對原假說的因果關(guān)系予以了證偽,。這種要求所有環(huán)節(jié)都必須沒有被證偽的方法不僅豐富了我們對因果關(guān)系作用機(jī)制的認(rèn)識, 而且也減小了X和Y之間出現(xiàn)的相關(guān)關(guān)系是虛假關(guān)系的可能性。以上對最常見,、常用的方法進(jìn)行了概括,。社會科學(xué)中用來分析因果關(guān)系的方法還有很多, 比如定性方法還有模式匹配法(PatternMatching)、因果敘述法(CausalNarrative),、Fuzzy-set法, 等等,。對定量分析法而言, 無論是回歸分析法還是實驗分析法, 都包括極其龐大、復(fù)雜的分支方法, 例如時間序列分析法,、路徑分析法,、工具變量法, 等等。本文不再也不可能一一列舉,。研究者在分析具體問題時, 常常會思考如下問題:究竟如何從紛繁蕪雜的現(xiàn)象之間發(fā)掘出因果原因? 應(yīng)該選取什么樣的(定性或定量)方法來證明假說中的因果關(guān)系? 如何選取樣本? 在前兩節(jié)內(nèi)容的基礎(chǔ)上, 本部分將對這些問題進(jìn)行初步的分析和解答。 許多人認(rèn)為, 如果可以用以上所介紹的因果分析方法來證明或者證偽現(xiàn)象之間的因果關(guān)系,那么能不能用這些方法來直接尋找理論, 提出理論呢? 一個最簡單的例子就是, 如果我們看到兩個變量之間存在聯(lián)系, 那么是否意味著我們就可以從中得出一個具有因果原因意義上的理論以對此進(jìn)行解釋呢? 回答是:幾乎不能,。任何有價值的理論, 都并非是對現(xiàn)象之間簡單關(guān)系的刻畫和描述, 而是建立對現(xiàn)象之間細(xì)致觀察和深刻理解的基礎(chǔ)之上的,。例如火燒皮膚會造成疼痛感、喝水可以解渴, 自然災(zāi)害導(dǎo)致作物歉收, 等等,??梢哉J(rèn)為這些陳述都反映出了一定的因果關(guān)系, 但沒有人認(rèn)為他們具有多少理論上的價值。相反, 理論本身是對重復(fù)性現(xiàn)象的高度抽象和概括, 是對現(xiàn)象的重新判斷,、加工,、組合與取舍。一個理論的提出, 不但意味著一種因果關(guān)系被建立起來, 而且代表著對現(xiàn)象本身含義的和與其他現(xiàn)象之間關(guān)系以及相對重要性的重新認(rèn)識,。而這些認(rèn)識和知識不可能通過因果分析方法本身來得到,。因此, 理論是先于因果分析方法的, 因果分析方法可以被用來檢驗理論, 但我們無法通過后者來得到前者,。例如對于一個理論假說:一個國家民族構(gòu)成越復(fù)雜, 政治局面越不穩(wěn)定。研究者考察了許多案例, 在案例1中, 某國的民族構(gòu)成是存在N1個民族,。在案例2中, 某國的民族構(gòu)成是存在N2個民族, N1 <N2, 但后者的政治穩(wěn)定性卻高于于前者,。因此研究者認(rèn)為, 民族構(gòu)成和政治穩(wěn)定性具有反向的因果關(guān)系, 從而否定了原理論假說。但是, 研究者在這里實際上對民族構(gòu)成的認(rèn)識出現(xiàn)了偏誤, 如果他用是否具有信仰不同甚至敵對宗教的少數(shù)民族來分析民族構(gòu)成的話, 那么民族構(gòu)成和政治穩(wěn)定性之間的關(guān)系就符合原理論假說,。但是, 這種對民族構(gòu)成分析方法的知識卻并不能由分析因果關(guān)系的方法中得到, 而只能由研究者對現(xiàn)象的深刻觀察和高度抽象、歸納中得到,。換言之, 因果分析方法本身并不能保證我們得到正確的理論認(rèn)識,。另外, 即使我們通過一定的因果分析得出現(xiàn)象之間的因果關(guān)系, 但如果我們考察的現(xiàn)象出現(xiàn)了關(guān)鍵性的遺漏, 那么這種因果關(guān)系實際上仍然是錯誤的認(rèn)識。例如, 研究者試圖考察公民對領(lǐng)導(dǎo)人是否滿意以及國外是否提供經(jīng)濟(jì)援助的因果關(guān)系,??疾斓腨1是是否對領(lǐng)導(dǎo)人(A)滿意(滿意=1, 不滿意=0), Y2是是否獲得國外援助(得到=1, 沒得到=0)。而解釋變量包括A的個人形象主管評價的好壞(X1, 好=1 或不好=0)以及國外領(lǐng)導(dǎo)人對A的評價(X2, 高=1 或不高=0),。運(yùn)用MOD方法, 得到的結(jié)果如下(表4):
根據(jù)MOD方法, 我們可以認(rèn)為X1是對領(lǐng)導(dǎo)人感到滿意的成分原因,。但實際上, 研究者遺漏了另一個真實的原因———領(lǐng)導(dǎo)人實施了他在競選中所承諾的政策(X3 )。實際上, 正確的理論應(yīng)該是X3 和X1 共同起作用, 導(dǎo)致公民對領(lǐng)導(dǎo)人的態(tài)度,。但是, 是否因該包括X3 這樣的知識并不能由具體的因果分析方法中得到,。另外, 也是我們經(jīng)常遇到的一個問題, 就是即使我們發(fā)現(xiàn)兩個變量之間具有很強(qiáng)的相關(guān)關(guān)系,在錯誤認(rèn)識的條件下, 也很難得到他們之間是否是因果關(guān)系的結(jié)論。例如, 一個理論假說是是否能上好的學(xué)校和日后事業(yè)是否成功之間存在著因果關(guān)系,。如果研究者的分析方法是找到一批包含了事業(yè)成功或不成功的職業(yè)人士, 然后把他們之前所受教育經(jīng)歷進(jìn)行對比, 發(fā)現(xiàn)的確原來上好學(xué)校的學(xué)生現(xiàn)在的事業(yè)更成功, 因而得出原有假說成立的結(jié)論,。但實際上他的這個關(guān)于因果關(guān)系的判斷卻極可能是錯誤的。實際上, 真正的原因是學(xué)生的家庭出身是否富裕, 出身富裕的家庭使學(xué)生能夠上好學(xué)校, 接受好的教育,。出身富裕也使他們在今后能找到更好的工作, 搭建更好的交際網(wǎng)絡(luò), 從而使他們事業(yè)更為成功,。在這里, 家庭出身是否富裕才是原因, 而是否上好學(xué)校和事業(yè)是否成功才是結(jié)果。由于錯誤地認(rèn)識了這三者之間的關(guān)系, 研究者所得到的因果關(guān)系的結(jié)論也是錯誤的, 盡管他所使用的驗證方法是無錯誤的,。但是否應(yīng)該考慮進(jìn)學(xué)生家庭出身這一因素, 并不能由分析方法本身來提供和保證,。總之, 提出一個反映因果關(guān)系的理論, 并不依賴于用來分析因果關(guān)系究竟是否存在的方法是否完美和正確。后者取決于研究者的專業(yè)訓(xùn)練程度和經(jīng)驗, 而前者除了這兩條因素外, 還取決于個人的研究興趣, 以及觀察,、抽象和綜合能力,。 對此并不存在一個唯一的判斷標(biāo)準(zhǔn)和回答。一般而言, 究竟選擇定性還是定量模型, 取決于一系列的因素, 包括: (1)研究的目的,。
前文已經(jīng)說過, 定量分析方法衡量的是解釋變量X對被解釋變量Y的平均作用效應(yīng),。相對而言, 定量分析方法考察的是對結(jié)果的具體原因解釋, 它很少涉及原因X具體程度的大小, 更多地采用二分法(例如高-低、多少,、有-沒有,、好-壞, 等等)來描述變量。因此, 如果研究者不僅希望判斷出是否存在因果關(guān)系, 還希望得到有關(guān)作用平均效果的知識, 那么就應(yīng)該采用定量分析方法, 比如對貨幣發(fā)行量和通貨膨脹之間因果關(guān)系的分析,。如果研究者更多的是希望找出變量之間的因果關(guān)系, 且希望弄清因于果的具體作用機(jī)制, 那么他們就應(yīng)該采用定性分析,。比如, 社會資本和經(jīng)濟(jì)發(fā)展之間的因果關(guān)系,。研究者當(dāng)然可以通過定量分析法判斷前者對后者的平均作用大小, 但同樣有價值的是社會資本通過什么樣的具體渠道影響經(jīng)濟(jì)發(fā)展。比如,通過增強(qiáng)社會參與,、增加公民之間的相互信任和合作, 等等,。對這些具體作用機(jī)制的分析, 定性分析方法更具優(yōu)勢。例如, 從理論上講, 民主和經(jīng)濟(jì)增長之間存在著雙向因果關(guān)系,。如果研究者感興趣的是討論民主或經(jīng)濟(jì)增長究竟在什么樣的具體條件下, 通過什么樣的具體渠道來影響對方, 而不是平均而言,其中一個變量對另一個變量起到多大作用, 那么定性方法應(yīng)該是更好的選擇,。但如果研究者的目的并不在于界定具體而言兩者如何互相作用(例如, 經(jīng)濟(jì)增長是通過提高識字率來促進(jìn)民主, 還是通過改變不同社會集團(tuán)力量對比來促進(jìn)民主),而是在總體平均水平上兩者之間的數(shù)量關(guān)系, 那么定量方法應(yīng)該是更好的選擇。當(dāng)然, 這種平均水平也是可以建立在一定約束條件之下的, 比如研究者僅對90年代, 或者亞洲地區(qū)的數(shù)量關(guān)系感興趣, 等等,。(2)因果關(guān)系的表現(xiàn)形式,。
具體地說, 就是是否具有多重因果路徑、或是否具有INUS原因,。對于不同的原因造成同樣的結(jié)果, 或同樣的原因造成不同的結(jié)果這樣的情況,使用定量分析方法會遇到較大的困難, 因為這意味著一個單一的模型結(jié)構(gòu)無法再能達(dá)到目的, 或者說, 隨著樣本的增加和減少,定量分析法所得到的結(jié)果會出現(xiàn)不穩(wěn)定和較大的差異,。對于INUS原因, 往往使用定性分析方法更為容易處理。原則上, INUS因果關(guān)系也可以用定量分析法處理,??紤]以下INUS原因:如果使用回歸方法分析, 那么正確的模型設(shè)定形式應(yīng)該是Y=α+β1 gX1 +β2 gX2 +β3g(X1 * X2 )+β4gZ (3) 但是, 如果INUS原因呈現(xiàn)如下形式:Y=(X1 *X2 * X3 )OR(Z1*Z2 ),那么正確的回歸模型設(shè)定形式就不僅應(yīng)該包括所有在INUS中出現(xiàn)的單獨(dú)項(Xi和Zi), 還應(yīng)該包括X1 ~ X3 之間的所有兩兩交叉項, 以及X1*X2 *X3 , 以及Z1 *Z2 交叉項,。這樣一來, 不僅大大降低了估計的自由度, 對樣本量的增加提出了極大的要求, 而且在實際中, 這種包含多項交叉項模型的估計結(jié)果往往并不令人滿意,。在這種情況下, 定性分析方法不失為一個明智的選擇。 必要/因果關(guān)系是一種確定性的關(guān)系, 因而適用于定性分析方法而不是定量分析方法,。不過,近年來一些方法研究的進(jìn)展也開始研究如何用回歸方法判斷必要關(guān)系, 盡管這方面的進(jìn)展并不是特別明顯(BraumoellerandGoertz2000),。 對于定量分析方法而言, 樣本量越大, 解釋變量Xs之間的差異越大越好, 因為這樣會提高定量分析(例如回歸分析)結(jié)果的統(tǒng)計性質(zhì)。并且, 定量分析注意解釋變量樣本選擇的差異性和隨機(jī)性, 對被解釋變量Y的具體取值并不予以特別的關(guān)注,。相反, 對于定性分析方法而言, 其對Y的選擇十分在意, 并且往往只會選取那些Y呈現(xiàn)具體特定值的樣本,。研究者指出, 如果研究目的是希望考察必要原因的話, 那么針對Y的具體取值而選擇樣本不僅不會造成估計偏差, 而且還是必要的(Bennet and Elman 2006 ;Braumoellerand Goertz2000)。例如, 如果要考察X是否是Y的必要條件, 就意味著需要考察如下條件是否成立:P(X=1 Y=1)=1, P(Y=1 X=0)=0,。這一條件說明, 我們必須考察所有Y取值為1的樣本, 而對于Y取值是否為0的樣本并不用在意,。一個例子是對革命爆發(fā)的研究。如果要考察某因素是造成革命爆發(fā)的必要條件, 那么就應(yīng)該收集那些革命爆發(fā)的所有樣本, 而對于那些沒有爆發(fā)革命的樣本則沒有必要選取,。例如Skocpol(1979)針對俄國,、法國和中國三國爆發(fā)社會革命的分析。雖然她也考察了其它沒有爆發(fā)革命的國家的案例, 但她舉這些案例的目的不是為了鑒定必要條件, 而是為了和爆發(fā)革命國家的案例進(jìn)行對比和說明,。以上的討論說明, 不存在一個先驗的標(biāo)準(zhǔn)規(guī)定定量(性)分析方法優(yōu)于定性(量)分析方法,。同樣地, 也不存在一個先驗的標(biāo)準(zhǔn)規(guī)定某一定量(性)分析方法優(yōu)于另一種定量(性)分析方法。究竟選取什么樣的方法, 取決于各種考慮因素,。另外, 各種分析方法可以用來檢驗理論的正確性, 或者說, 是對理論的證偽,。但是, 我們不能指望通過這些分析方法本身來發(fā)現(xiàn)理論。要得到一個理論, 必須依賴于這些方法之外的知識,、興趣和經(jīng)驗,。由南開大學(xué)數(shù)量經(jīng)濟(jì)研究所所長王群勇教授及其學(xué)術(shù)團(tuán)隊主辦,,旨在定期與大家分享計量經(jīng)濟(jì)學(xué)的相關(guān)理論及軟件使用技巧,覆蓋經(jīng)濟(jì)學(xué),、管理學(xué),、社會學(xué)等學(xué)科,為廣大學(xué)友提供優(yōu)質(zhì)學(xué)術(shù)內(nèi)容,。
|