導言: 如下是連玉君老師上課的板書,。你可以看出什么是 「固定效應」,,什么是 「雙向固定效應模型」,,什么是 「POLS」 v.s. 「FE」 以及二者的差別,。 所以,面板數(shù)據(jù)模型其實沒有你想象的那么復雜,! 常見的數(shù)據(jù)形式有時間序列數(shù)據(jù)( Time series data ),,截面數(shù)據(jù)( Cross-sectional data )和面板數(shù)據(jù)( Panel data )。 從維度來看,,時間序列數(shù)據(jù)和截面數(shù)據(jù)均為一維,。面板數(shù)據(jù)可以看做為時間序列與截面混合數(shù)據(jù),因此它是二維數(shù)據(jù),。數(shù)據(jù)形式如下: 世界是復雜的,,所表現(xiàn)出來的行為特征也是復雜的,我們需要面板數(shù)據(jù),。 例如,,欲研究影響企業(yè)利潤的決定因素,我們認為企業(yè)規(guī)模 (截面維度)和技術(shù)進步(時間維度)是兩個重要的因素,。截面數(shù)據(jù)僅能研究企業(yè)規(guī)模對企業(yè)利潤的影響程度,,時間序列數(shù)據(jù)僅能研究技術(shù)進步對企業(yè)利潤的影響,而面板數(shù)據(jù)同時考慮了截面和時間兩個維度 (從哪個維度看都好看),,可以同時研究企業(yè)規(guī)模和技術(shù)進步對企業(yè)利潤的影響,。 正因為面板數(shù)據(jù)所具有的獨特優(yōu)勢,許多模型從截面數(shù)據(jù)擴展到面板數(shù)據(jù)框架下,。通過
本文主要就普通靜態(tài)面板數(shù)據(jù)模型進行介紹,,包括模型形式設定,、模型分類與選擇及 Stata 程序?qū)崿F(xiàn)等。
面板數(shù)據(jù)模型同時包含了截面和時間兩個維度,,設 i (i=1, ..., N) 表示截面 (個體),,t (t=1, ..., T) 表示時間,設定如下線性模型: 其中,,
顯然, 和 在多數(shù)情況下都是無法直接觀測或難以量化的,,因此也就無法進入模型,。在截面分析中往往會引起遺漏變量的問題。 面板數(shù)據(jù)模型的主要用途之一就在于處理這些不可觀測的個體效應或時間效應,。當對所有的 i, 均相等時,,模型退化為混合數(shù)據(jù)模型 ( Pooled OLS ),可直接用 根據(jù)個體數(shù)N 和時期數(shù) T的大小,通??梢詫⒚姘鍞?shù)據(jù)分為宏觀面板和微觀面板:宏觀面板一般為 「大T小N」,,微觀面板一般為「小T大N」。依據(jù) N,、T大小不同,,所采用的參數(shù)估計方法和分析中關(guān)注的重點也不盡相同。
面板數(shù)據(jù)模型可以分為固定效應( Fixed effect model )和隨機效應模型( Random effect model ),。當 和相關(guān),,即,則該模型為固定效應模型,;反之為隨機效應模型,。 兩種模型的差異主要反映在對 “個體效應” 的處理上。 固定效應模型假設個體效應在組內(nèi)是固定不變的,,個體間的差異反映在每個個體都有一個特定的截距項上,; 隨機效應模型則假設所有的個體具有相同的截距項, 個體間的差異是隨機的,,這些差異主要反應在隨機干擾項的設定上,。 基于此,一種常見的觀點認為,, 當我們的樣本來自一個較小的母體時,,我們應該使用固定效應模型,而當樣本來自一個很大的母體時,, 應當采用隨機效應模型,。 然而,在具體的實例應用中,大母體和小母體并沒有一個嚴格的界限,,我們并不能明確地區(qū)分我們的樣本來自一個較大母體還是較小的母體,。因此,有些學者認為,,區(qū)分固定效應模型和隨機效應模型應當通過檢驗使用二者的假設條件是否滿足,。 下面我們討論混合數(shù)據(jù)模型、固定效應模型和隨機效應模型的選擇,。 2.1,、固定效應的檢驗固定效應的檢驗本質(zhì)即檢驗個體間截距項的差異是否顯著,即=0,。根據(jù)假設檢驗原理,,設定如下原假設 若結(jié)果拒絕原假設,則表明個體間截距項存在顯著差異,,模型中需要考慮固定效應,。反之,混合 OLS 模型更為合適,。通??梢岳?$F$ 統(tǒng)計量來檢驗上述假設是否成立: 其中:為固定效應模型的擬合優(yōu)度系數(shù)(不受約束模型),為混合數(shù)據(jù)模型的擬合優(yōu)度系數(shù)(受約束模型),;N 和T 分別為截面與時期數(shù),;K 為解釋變量個數(shù)。若原假設被拒絕,,則說明個體效應顯著,,固定效應模型比混合數(shù)據(jù)模型更優(yōu)。同理,,可以構(gòu)造相似的F統(tǒng)計量檢驗時期效應是否顯著,。 2.2、隨機效應的檢驗Breusch and Pagan (1980) 提出了基于面板隨機效應模型殘差的 LM統(tǒng)計量,,構(gòu)造如下原假設來檢驗隨機效應: 相應的檢驗統(tǒng)計量LM為: 在原假設下,,該統(tǒng)計量服從自由度為1的卡方分布。若拒絕原假設則表明存在隨機效應,。 2.3,、固定效應還是隨機效應?通過檢驗說明個體效應 () 需要被納入到模型中后,,應該將 看成隨機干擾項的一部分(隨機效應模型)還是待估計參數(shù)(固定效應模型),,下面介紹一些基本方法。 (1) Hausman 檢驗從基本定義出發(fā),,可以通過通過檢驗個體效應與其它解釋變量是否相關(guān)作為進行固定效應和隨機效應模型篩選的依據(jù),。此時,,我們可以采用 Hausman 檢驗。其基本思想是:在和其他解釋變量不相關(guān)假定下,,采用組內(nèi)變換法估計固定效應模型和采用GLS法隨機效應模型得到的參數(shù)估計都是無偏且一致的,,只是前者不具有效性。若原假設不成立,,則固定效應模型的參數(shù)估計仍然是一致的,,但隨機效應模型不一致。因此,,在原假設下,,二者的參數(shù)估計應該不會有顯著的差異, 可以基于二者參數(shù)估計的差異構(gòu)造統(tǒng)計檢驗量,。 假設為固定效應模型的組合估計,,為隨機效應模型的 GLS 估計。在原假設成立下,,有 根據(jù)方差公式 又因為,,因此有 Hausman 檢驗基于如下 Wald 統(tǒng)計量 若拒絕原假設,表明個體效應 與解釋變量相關(guān),,此時隨機效應模型的結(jié)果不一致,,應選擇固定效應模型。 (2) 穩(wěn)健Hausman檢驗Wooldridge (2002)當不服從同方差假設時,,傳統(tǒng)的 Hausman 檢驗方法失效。Wooldridge (2002) 提出了一種穩(wěn)健版的 Hausman 檢驗方法,。建立如下輔助模型: 其中:為時變解釋變量,。當 RE 估計為完全有效估計時,利用 Wald 統(tǒng)計量做 檢驗所得結(jié)果應該漸近相等于標準的檢驗,。當RE 估計為不是完全有效估計時,,Wooldridge (2002) 提出在cluster-robust 標準誤下做上述檢驗。 (3) 修正的 Hausman統(tǒng)計量在固定效應模型與隨機效應模型選擇上,,Hausman 統(tǒng)計量被廣泛地應用于實證研究中,。從上述看,該檢驗統(tǒng)計量漸近服從卡方分布,,值應該為正數(shù),。然而,實際問題中計算出的統(tǒng)計值常出現(xiàn)負值的情況,。針對出現(xiàn)負值這一現(xiàn)象,,許多學者進行了研究,但并未形成一致的觀點,。 一種觀點認為出現(xiàn)這樣的情況主要是由小樣本偏誤引起,,并建議此時應該解釋為不能拒絕原假設,,應選擇隨機效應模型 (如,Baltagi, 2008; Hsiao, 2003,;Statacrop, 2009),。 另一種觀點認為該統(tǒng)計量出現(xiàn)負值恰恰表明原假設不合理,此時應該選擇固定效應模型,。這些研究表明這種狀況不僅僅出現(xiàn)在小樣本情況下,,在大樣本情況下也時有發(fā)生 (Schreiber, 2008; Magazzini and Calzolarr, 2010)。如沈根祥 (2010) 在利用高頻數(shù)據(jù)時也出現(xiàn)統(tǒng)計量為負值的情形,。 連玉君等 (2014) 利用蒙特卡洛模擬方法得到內(nèi)生性問題 (即解釋變量與個體效應相關(guān)) 是導致統(tǒng)計量出現(xiàn)負值的主要原因,。模擬分析表明,修正的 Hausman 統(tǒng)計量,,以及過度識別檢驗方法能夠很好地克服上述缺陷,。 修正的 Hausman 統(tǒng)計量主要是對或進行調(diào)整。調(diào)整后的統(tǒng)計量為 或者為 其中:和分別為固定效應模型和隨機效應模型下的均方根誤差,。 (4) 基于過度識別檢驗的 Wald 統(tǒng)計量基于通常的 Hausman 統(tǒng)計量在存在異方差 (heteroskedastic) 情況下失效且當定義 cluster-robust 標準誤時不再適用問題,,Arellano (1993) 基于過度識別檢驗提出了 Wald 檢驗統(tǒng)計量解決這一問題。在條件同方差情況下,,該檢驗統(tǒng)計量與通常的Hausman統(tǒng)計量漸近相等,。此外,該統(tǒng)計量始終為正數(shù),。 如前所述,,F(xiàn)E 估計和 RE 估計都需要滿足一般意義上的外生性假設條件,即,,而 RE 估計還要進一步滿足面板特定的外生性假設條件,,即。 我們可以將這個新增加的正交條件視為一個過度識別約束,,以此來區(qū)分 RE 估計的前提假設是否合理,。我們可以通過估計如下模型來構(gòu)造 Wald 統(tǒng)計量 其中:,,。和具有相似的定義,。顯然,在上式中,,的 OLS 估計即為 RE 估計量,,而的 OLS 估計即為之間的差異,即 利用 Wald 檢驗假設,,所得統(tǒng)計量即為過度識別檢驗的 Wald 統(tǒng)計量,。 (5) Mundlak’s (1978) 方法在原假設成立情況下,估計量的有效性假設 (存在最小漸近方差) 是運用Hausman 檢驗的前提條件,。然而,,當誤差項存在異方差或者序列相關(guān)時,,這個條件往往不能夠被滿足。即使在這個條件滿足情況下,,該方法也可能存在小樣本問題,。 這里介紹另外一種方法,即 Mundlak’s(1978) 提出的一種檢驗方法,。與通常的 Hausman檢驗不同,,該方法在誤差項不滿足同方差和序列不相關(guān)情況下也是有效的。設定如下線性模型: Mundlak 方法的思想為檢驗和解釋變量 是否存在相關(guān),。因此,,建立如下關(guān)系式: 其中:是 的組內(nèi)平均,是非時變的,,且與自變量不相關(guān)的,。 要保證 和解釋變量 不相關(guān),只需=0,。根據(jù)以上式子,,可以轉(zhuǎn)化為檢驗如下方程的系數(shù) 因此,只需要回歸這個方程,,并檢驗是否成立,。若拒絕原假設,則 和解釋變量 存在相關(guān),,應選擇固定效應模型,。 (6) Bootstrap Hausman檢驗傳統(tǒng)的 Hausman 檢驗統(tǒng)計量可定義為 傳統(tǒng) Hausman 檢驗有效的前提條件是,在原假設為真的情況下,,其中一個估計量為完全有效的,。然而,實際應用中這個假設通常不被滿足,。特別地,,當利用穩(wěn)健標準誤時,,估計量通常非有效,。 Bootstrap方法可以在估計量非有效的情況估計。假設重復進行 B 次抽樣,,可以得到 B 個和估計值,,進而可得到 B 個估計值。可以利用下面式子進行估計 其中:,。
本部分以 Kleiber 和 Zeileis (2008) 的Grunfeld.dta數(shù)據(jù)集為例,,說明運用面板數(shù)據(jù)模型的一般步驟。 3.1. 讀取數(shù)據(jù)與面板數(shù)據(jù)設定1. webuse grunfeld,clear //利用webuse從網(wǎng)絡讀取數(shù)據(jù) 1xtset company year,yearly //設置面板數(shù)據(jù)格式,,利用 Stata 中`xt`開頭的命令,,必須用該命令進行設置,。yearly表示年度數(shù)據(jù),詳細參考 `help xtset` 3.2. 模型檢驗與模型選擇本部分內(nèi)容安排如下: (1)個體效應和隨機效應的聯(lián)合顯著性檢驗,,以判別是否需要利用面板數(shù)據(jù)模型,; (2)若表明需用面板數(shù)據(jù)模型,利用Hausman統(tǒng)計量選擇固定效應模型或隨機效應模型更優(yōu),; (3)考慮到一般的Hausman檢驗在異方差和自相關(guān)情況下失效風險問題,,對異方差,序列相關(guān)進行檢驗,,以說明是否需要利用其它方法進行選擇,; (4)針對一般的Hausman檢驗統(tǒng)計量可能為負值且對在異方差和序列相關(guān)情況不穩(wěn)健問題,對穩(wěn)健 Hausman 檢驗,,修正的 Hausman統(tǒng)計量, 基于過度識別檢驗的Wald統(tǒng)計量法,,Mundlak’s (1978)法,基于 bootstrap法的hausman檢驗等方法的Stata實現(xiàn)進行講解,。 (5)在選定固定效應模型或隨機效應模型后,,依據(jù)誤差項結(jié)構(gòu)(異方差,序列相關(guān),,截面相依)以及不同面板結(jié)構(gòu)(「大T小N」,,「大N小T」), 介紹相應的參數(shù)估計命令,。 (1)個體效應和隨機效應的聯(lián)合顯著性檢驗以invest為因變量,,mvalue kstock為自變量,建立如下模型: 其中:和為待估系數(shù),。 利用Stata中 1xtreg invest mvalue kstock,fe //fe表示固定效應;若同時包括時期虛擬變量,xtreg invest mvalue kstock i.year,fe,,利用 testparm 檢驗 1xtreg invest mvalue kstock,re //re表示隨機效應 1xttest0 //檢驗隨機效應是否顯著,,需要運行隨機效應模型后使用 (2)Hausman檢驗上述結(jié)果說明了有必要考慮個體效應和隨機效應,接下來利用
利用 1. hausman name-consistent [name-efficient] [, options] 接下來進行hausman檢驗,, 1xtreg invest mvalue kstock,fe (3)異方差和序列相關(guān)檢驗前文已經(jīng)說明,,當模型誤差項存在序列相關(guān)或異方差時,此時經(jīng)典的Hausman 檢驗不在適用,,下面我們進行序列相關(guān)和異方差檢驗,。 序列相關(guān)檢驗 先進行序列相關(guān)檢驗,,在固定效應模型時可以利用命令 1xtserial invest mvalue kstock 同樣地,,在隨機效應時可以利用命令 異方差檢驗 Greene (2000, p598) 提出一種修正的Wald統(tǒng)計量檢驗異方差,,與標準的Wald統(tǒng)計量、LR和LM統(tǒng)計量不同,,修正Wald檢驗同樣適用于模型殘差不服從正態(tài)分布情況下,。值得一提的是,在大N小T情況下,,該方法的檢驗功效較低,。該檢驗的原假設為同方差。 1xtreg invest mvalue kstock,fe (4)模型選擇其它方法第一種:穩(wěn)健 Hausman 檢驗** 目前 Stata 中沒有相應的命令進行穩(wěn)健 Hausman檢驗,, 根據(jù) 2.3 中 (2) 部分公式,,可以編寫如下代碼進行檢驗 1webuse grunfeld, clear
第二種: 修正的 Hausman統(tǒng)計量 1xtreg invest mvalue kstock,fe 1hausman fe_result re_result,sigmaless
第三種:基于過度識別檢驗的Wald統(tǒng)計量 1 xtreg invest mvalue kstock, re cluster(company) 運行后提示需要更高版本的 上述結(jié)果表明拒絕假設,,應該選擇固定效應模型。
第四種:Mundlak’s (1978)法
根據(jù)上文所述原理,,可通過如下三個步驟實現(xiàn)該方法: 第一:計算解釋變量均值 1local xlist "mvalue kstock" 第二步:估計包含均值的回歸方程: 1xtreg invest mvalue kstock mean_mvalue mean_kstock,re vce(robust) 第三步:利用 1test mean_mvalue mean_kstock 結(jié)果如下 此外,,也可以通過外部命令 1mundlak invest mvalue kstock,full
第五種:基于 bootstrap法的hausman檢驗
由于存在序列相關(guān)和異方差,,經(jīng)典的 1xtreg invest mvalue kstock,fe 從檢驗結(jié)果可以發(fā)現(xiàn),,利用經(jīng)典的 除了序列相關(guān)和異方差檢驗之外,,截面相依檢驗也尤為重要,。在固定效應模型中,,可以利用命令 (5)相關(guān) Stata 命令推薦依據(jù)誤差項結(jié)構(gòu)(異方差,,序列相關(guān),,截面相依)以及不同面板結(jié)構(gòu)(「大TT小NN」,「大NN小TT」),, 下文介紹相應的參數(shù)估計命令,。 截面相依檢驗 1qui xtreg invest mvalue kstock, fe 1 qui xtreg invest mvalue kstock, re 當誤差項存在序列相關(guān),異方差或截面相依時,,依據(jù)形式不同,,可以利用不同的方法和命令進行估計,詳細可以參考 Hoechle (2007),。 幾點說明
?
雖然本文系統(tǒng)地介紹了靜態(tài)面板數(shù)據(jù)模型的各種檢驗方法,,但從現(xiàn)有的文獻來看,實操層面的做法往往是單刀直入,,甚至多少有些粗暴,。 具體而言:
?
1clear |
|