來源:本文授權(quán)轉(zhuǎn)載自數(shù)量經(jīng)濟(jì)學(xué) 本文包括靜態(tài)與動(dòng)態(tài)面板數(shù)據(jù)處理方法,包含hausman檢驗(yàn),,固定效應(yīng)檢驗(yàn),隨機(jī)效應(yīng)檢驗(yàn),,異方差檢驗(yàn),、相關(guān)檢驗(yàn),面板logit與面板probit模型,、面板泊松模型,、面板負(fù)二項(xiàng)模型等眾多干貨內(nèi)容,歡迎閱讀,。 本文目錄 一,、靜態(tài)面板數(shù)據(jù) ●數(shù)據(jù)處理 ●模型的篩選和檢驗(yàn) 1、檢驗(yàn)個(gè)體效應(yīng)(混合效應(yīng)還是固定效應(yīng)) 2,、檢驗(yàn)時(shí)間效應(yīng)(混合效應(yīng)還是隨機(jī)效應(yīng)) 3,、檢驗(yàn)固定效應(yīng)模型or隨機(jī)效應(yīng)模型 (檢驗(yàn)方法:Hausman檢驗(yàn)) ●模型的篩選和檢驗(yàn) 1、固定效應(yīng)估計(jì) 2,、隨機(jī)效應(yīng)估計(jì)省略 3,、時(shí)間固定效應(yīng)(以上分析主要針對(duì)的是個(gè)體效應(yīng)) ●異方差和自相關(guān)檢驗(yàn) 1,、異方差檢驗(yàn) (組間異方差) 2、序列相關(guān)檢驗(yàn) 3,、“異方差—序列相關(guān)”穩(wěn)健型標(biāo)準(zhǔn)誤 4,、截面相關(guān)檢驗(yàn) 5、“異方差—序列相關(guān)—截面相關(guān)”穩(wěn)健型標(biāo)準(zhǔn)誤 二,、動(dòng)態(tài)面板數(shù)據(jù) 三,、面板logit與面板probit模型 四、面板泊松模型 五,、面板負(fù)二項(xiàng)模型 六,、面板Tobit模型 七、面板工具變量法 八,、面板隨機(jī)前沿模型 一.靜態(tài)面板數(shù)據(jù)的STATA處理命令 (一)數(shù)據(jù)處理 輸入數(shù)據(jù) use 'E:\stata\data\FDI.dta', clear tsset code year 該命令是將數(shù)據(jù)定義為“面板”形式 xtdes 該命令是了解面板數(shù)據(jù)結(jié)構(gòu) summarize lngdp lnfdi lnie lnex lnim lnci lngp 各變量的描述性統(tǒng)計(jì)(統(tǒng)計(jì)分析) 拓展命令: gen lag_y=L.y 產(chǎn)生一個(gè)滯后一期的新變量 gen F_y=F.y 產(chǎn)生一個(gè)超前項(xiàng)的新變量 gen D_y=D.y 產(chǎn)生一個(gè)一階差分的新變量 gen D2_y=D2.y 產(chǎn)生一個(gè)二階差分的新變量 (二)模型的篩選和檢驗(yàn) 1,、檢驗(yàn)個(gè)體效應(yīng)(混合效應(yīng)還是固定效應(yīng))(原假設(shè):使用OLS混合模型) xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe 對(duì)于固定效應(yīng)模型而言,回歸結(jié)果中最后一行匯報(bào)的F統(tǒng)計(jì)量便在于檢驗(yàn)所有的個(gè)體效應(yīng)整體上顯著,。在我們這個(gè)例子中發(fā)現(xiàn)F統(tǒng)計(jì)量的概率為0.0000,,檢驗(yàn)結(jié)果表明固定效應(yīng)模型優(yōu)于混合OLS模型。 2,、檢驗(yàn)時(shí)間效應(yīng)(混合效應(yīng)還是隨機(jī)效應(yīng))(檢驗(yàn)方法:LM統(tǒng)計(jì)量) (原假設(shè):使用OLS混合模型) qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re (加上“qui”之后第一幅圖將不會(huì)呈現(xiàn)) xttest0 可以看出,,LM檢驗(yàn)得到的P值為0.0000,表明隨機(jī)效應(yīng)非常顯著,??梢姡S機(jī)效應(yīng)模型也優(yōu)于混合OLS模型,。 3,、檢驗(yàn)固定效應(yīng)模型or隨機(jī)效應(yīng)模型 (檢驗(yàn)方法:Hausman檢驗(yàn)) 原假設(shè):使用隨機(jī)效應(yīng)模型(個(gè)體效應(yīng)與解釋變量無關(guān)) 通過上面分析,可以發(fā)現(xiàn)當(dāng)模型加入了個(gè)體效應(yīng)的時(shí)候,,將顯著優(yōu)于截距項(xiàng)為常數(shù)假設(shè)條件下的混合OLS模型,。但是無法明確區(qū)分FE or RE的優(yōu)劣,這需要進(jìn)行接下來的檢驗(yàn),,如下: Step1:估計(jì)固定效應(yīng)模型,,存儲(chǔ)估計(jì)結(jié)果 Step2:估計(jì)隨機(jī)效應(yīng)模型,存儲(chǔ)估計(jì)結(jié)果 Step3:進(jìn)行Hausman檢驗(yàn) xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re est store re xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe est store fe hausman fe re (或者更優(yōu)的是hausman fe,sigmamore/ sigmaless) 可以看出,,hausman檢驗(yàn)的P值為0.0000,,拒絕了原假設(shè),認(rèn)為隨機(jī)效應(yīng)模型的基本假設(shè)得不到滿足,。此時(shí),,需要采用工具變量法或者使用固定效應(yīng)模型。 (三)靜態(tài)面板數(shù)據(jù)模型估計(jì) 1,、固定效應(yīng)模型估計(jì) 其中選項(xiàng)fe表明我們采用的是固定效應(yīng)模型,,表頭部分的前兩行呈現(xiàn)了模型的估計(jì)方法,、界面變量的名稱(id)、以及估計(jì)中使用的樣本數(shù)目和個(gè)體的數(shù)目,。第3行到第5行列示了模型的擬合優(yōu)度,、分為組內(nèi)、組間和樣本總體三個(gè)層面,,通常情況下,,關(guān)注的是組內(nèi)(within),第6行和第7行分別列示了針對(duì)模型中所有非常數(shù)變量執(zhí)行聯(lián)合檢驗(yàn)得到的F統(tǒng)計(jì)量和相應(yīng)的P值,,可以看出,,參數(shù)整體上相當(dāng)顯著。需要注意的是,,表中最后一行列示了檢驗(yàn)固定效應(yīng)是否顯著的F統(tǒng)計(jì)量和相應(yīng)的P值,。顯然,本例中固定效應(yīng)非常顯著,。 2,、隨機(jī)效應(yīng)估計(jì)省略 3、時(shí)間固定效應(yīng)(以上分析主要針對(duì)的是個(gè)體效應(yīng)) 如果希望進(jìn)一步在上述模型中加入時(shí)間效應(yīng),,可以采用時(shí)間虛擬變量來實(shí)現(xiàn),。首先,我們需要定義一下T-1個(gè)時(shí)間虛擬變量,。 tab year ,gen(dumt) (tab命令用于列示變量year的組類別,,選項(xiàng)gen(dumt)用于生產(chǎn)一個(gè)以dumt開頭的年度虛擬變量) drop dumt1 (作用在于去掉第一個(gè)虛擬變量以避免完全共線性) 若在固定效應(yīng)模型中加入時(shí)間虛擬變量,則估計(jì)模型的命令為: xtreg lngdp lnfdi lnie lnex lnim lnci lngp dumt*,fe (四)異方差和自相關(guān)檢驗(yàn) 1,、異方差檢驗(yàn) (組間異方差)本節(jié)主要針對(duì)的是固定效應(yīng)模型進(jìn)行處理 1)檢驗(yàn) 原假設(shè):同方差,,需要檢驗(yàn)?zāi)P椭惺欠翊嬖诮M間異方差,需要使用xttest3命令。 qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp ,fe xttest3 顯然,,原假設(shè)被拒絕,。此時(shí),需要進(jìn)一步以獲得參數(shù)的GLS估計(jì)量,,命令為xtgls: xtgls lngdp lnfdi lnie lnex lnim lnci lngp,panels(heteroskedastic) 其中,組間異方差通過panels()選項(xiàng)來設(shè)定,。上述結(jié)果是采用兩步獲得,,即,先采用OLS估計(jì)不考慮異方差的模型,,進(jìn)而利用其殘差計(jì)算,。并最終得到FGLS估計(jì)量。 2,、序列相關(guān)檢驗(yàn) 對(duì)于T較大的面板而言,,往往無法完全反映時(shí)序相關(guān)性,,此時(shí)便可能存在序列相關(guān),在多數(shù)情況下被設(shè)定為AR(1)過程,。 原假設(shè):序列不存在相關(guān)性,。 (1) FE模型的序列相關(guān)檢驗(yàn) 對(duì)于固定效應(yīng)模型,可以采用Wooldridge檢驗(yàn)法,,命令為xtserial: xtserial lngdp lnfdi lnie lnex lnim lnci lngp (2) RE模型的序列相關(guān)檢驗(yàn) 對(duì)于RE模型,,可以采用xttest1命令來執(zhí)行檢驗(yàn): qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp dumt*,re xttest1 這里匯報(bào)了4個(gè)統(tǒng)計(jì)量,分別用于檢驗(yàn)RE模型中隨機(jī)效應(yīng)(單尾和雙尾),、序列相關(guān)以及二者的聯(lián)合顯著性,,檢驗(yàn)結(jié)果表明存在隨機(jī)效應(yīng)和序列相關(guān),而且對(duì)隨機(jī)效應(yīng)和序列相關(guān)的聯(lián)合檢驗(yàn)也非常顯著,。 (3) 穩(wěn)健型估計(jì) 上述結(jié)果表明,,無論是FE還是RE模型,干擾項(xiàng)中都存在顯著的序列相關(guān),。為此,,我們進(jìn)一步采用xtregar命令來估計(jì)模型,首先考慮固定效應(yīng)模型: xtregar lngdp lnfdi lnie lnex lnim lnci lngp dumt*,fe lbi 3,、“異方差—序列相關(guān)”穩(wěn)健型標(biāo)準(zhǔn)誤 雖然上述估計(jì)方法在估計(jì)方差-協(xié)方差矩陣時(shí)考慮了異方差和序列相關(guān)的影響,,但都未將兩者聯(lián)立在一起考慮,要獲得“異方差-序列相關(guān)”穩(wěn)健型標(biāo)準(zhǔn)誤,,只需在xtreg命令中附加vce(robust)或者vce(cluster)選項(xiàng)即可,。例如,對(duì)于FE模型,,我們可以執(zhí)行如下命令: xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe vce(robust) 與之前未經(jīng)處理的估計(jì)結(jié)果相比,,附加命令vce(robust)選項(xiàng)時(shí)的結(jié)果,雖然系數(shù)的估計(jì)值未發(fā)生變化,,但此時(shí)得到的標(biāo)準(zhǔn)誤明顯增大了,,致使得到的估計(jì)結(jié)果更加保守。對(duì)于面板數(shù)據(jù)模型而言,,STATA在計(jì)算所謂的“robust”標(biāo)準(zhǔn)誤時(shí),,是以個(gè)體為單位調(diào)整標(biāo)準(zhǔn)誤的。因此,,我們得到的“robust”標(biāo)準(zhǔn)誤其實(shí)是同時(shí)調(diào)整了異方差和序列相關(guān)后的標(biāo)準(zhǔn)誤,。換言之,上述結(jié)果與設(shè)定vce(cluster)選項(xiàng)的結(jié)果完全相同,。 4,、截面相關(guān)檢驗(yàn) 原假設(shè):截面之間不存在著相關(guān)性 (1)FE模型檢驗(yàn) 對(duì)于FE模型,可以利用xttest2命令來檢驗(yàn)截面相關(guān)性: qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe xttest2 (該命令主要針對(duì)的是大T小N類型的面板數(shù)據(jù),,在本例中無法使用,,故圖標(biāo)略去,。) (2)RE模型檢驗(yàn) 對(duì)于RE模型,可以利用xtcsd命令來檢驗(yàn)截面相關(guān)性: qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re xtcsd,pesaran (下面命令是另一個(gè)檢驗(yàn)指標(biāo)) xtcsd,frees 可以看出,,兩種不同的檢驗(yàn)方法均顯示面板數(shù)據(jù)存在著截面相關(guān)性,。 5、“異方差—序列相關(guān)—截面相關(guān)”穩(wěn)健型標(biāo)準(zhǔn)誤 1)FE模型估計(jì) 對(duì)于FE模型,,在確認(rèn)上述存在著截面相關(guān)的情況下,,我們可以采用Hoechle(2007)編寫的xtscc命令獲取Driscoll and Kraay(1998)提出的“異方差—序列相關(guān)—截面相關(guān)”穩(wěn)健型標(biāo)準(zhǔn)誤: xtscc lngdp lnfdi lnie lnex lnim lnci lngp,fe 這里,xtscc命令會(huì)自動(dòng)選擇的滯后階數(shù)為2,,系數(shù)估計(jì)值和Within-R2與xtreg,fe的結(jié)果完全相同,,但標(biāo)準(zhǔn)誤存在著較大差異??梢?,在本例中,截面相關(guān)對(duì)統(tǒng)計(jì)推斷有較大的影響,。 若讀者有跟高的方法來確定自相關(guān)的滯后階數(shù),,則可以通過lag( )選項(xiàng)設(shè)定。當(dāng)然,,在多數(shù)情況下,,這很難做到。不過我們可以通過附加lag(0)來估計(jì)僅考慮異方差和截面相關(guān)的穩(wěn)健型標(biāo)準(zhǔn)誤,,命令如下: xtscc lngdp lnfdi lnie lnex lnim lnci lngp,fe lag(0) (2) RE模型估計(jì)(略,,待補(bǔ)充) 二.動(dòng)態(tài)面板數(shù)據(jù)的STATA處理命令 (一)差分GMM xtabond Setup webuse abdata Basic model with two lags of dependent variable included as regressors xtabond n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) xtabond n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) vce(robust) xtabond n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) twostep Treat w and k as predetermined and include w, L.w, k, L.k, and L2.k as additional regressors xtabond n l(0/2).ys yr1980-yr1984, lags(2) pre(w, lag(1,.)) pre(k, lag(2,.)) Treat L.w and L2.k as endogenous and include w, L.w, k, L.k, and L2.k as additional regressors xtabond n l(0/2).ys yr1980-yr1984, lags(2) endogenous(w, lag(1,.)) endogenous(k, lag(2,.)) (二)系統(tǒng)GMM Setup webuse abdata Basic model with strictly exogenous covariates and two lags of the dependent variable xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) Same model with a robust VCE xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) vce(robust) Two-step estimator of the same model xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) twostep vce(robust) Now allow some of the covariates to be predetermined xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) twostep pre(w, lag(1,.)) pre(k,lag(2,.)) Now allow some of the covariates to be endogenous xtdpdsys n l(0/1).ys yr1980-yr1984, lags(2) twostep endogenous(w, lag(1,.)) endogenous(k,lag(2,.)) (三)內(nèi)生性檢驗(yàn) estat sargan 三.logit與probit模型 對(duì)于面板數(shù)據(jù),如果被解釋變量為離散變量或者虛擬變量時(shí),,使用離散選擇模型,,也就是面板二值選擇模型。以二值選擇(被解釋變量取值為0或1)為例,,當(dāng)被解釋變量取1的概率為標(biāo)準(zhǔn)正態(tài)分布時(shí),,使用probit模型;當(dāng)被解釋變量取1的概率為logistic分布時(shí),,使用logit模型,。 面板二值選擇模型固定效應(yīng) xtprobit y x1 x2 x3,fe xtlogit y x1 x2 x3,,fe 面板二值選擇模型隨機(jī)效應(yīng) Random-effects (RE) model xtprobit depvar [indepvars] [if] [in] [weight] [, re RE_options] Random-effects (RE) model xtlogit depvar [indepvars] [if] [in] [weight] [, re RE_options] 案例講解: Setup webuse union Random-effects logit model xtlogit union age grade i.not_smsa south##c.year Fixed-effects logit model xtlogit union age grade i.not_smsa south##c.year, fe Hausman檢驗(yàn) hausman fe re 四.面板泊松模型 面板泊松模型命令為xtpoisson,,語法格式為: Random-effects (RE) model xtpoisson depvar [indepvars] [if] [in] [weight] [, re RE_options] Random-effects model xtpoisson accident op_75_79 co_65_69 co_70_74 co_75_79, exposure(service) irr Fixed-effects model xtpoisson accident op_75_79 co_65_69 co_70_74 co_75_79, exposure(service) irr fe 五.面板負(fù)二項(xiàng)模型 面板負(fù)二項(xiàng)模型模型命令為xtnbreg,語法格式為: Syntax Random-effects (RE) and conditional fixed-effects (FE) overdispersion models xtnbreg depvar [indepvars] [if] [in] [weight] [, [re|fe] RE/FE_options] Population-averaged (PA) model xtnbreg depvar [indepvars] [if] [in] [weight], pa [PA_options] 案例介紹為: Setup webuse airacc Random-effects model xtnbreg i_cnt inprog, exposure(pmiles) irr 其中,,默認(rèn)的為re隨機(jī)效應(yīng),而irr表示匯報(bào)發(fā)生率比 Fixed-effects model xtnbreg i_cnt inprog, exposure(pmiles) irr fe 六.面板Tobit模型 面板Tobit模型模型命令為xttobit,,語法格式為: xttobit depvar [indepvars] [if] [in] [weight] [, options] 其中depvar :被解釋變量,。indepvars :解釋變量,。noconstant :不含截距項(xiàng)。ll[(varname|#)] :左刪失變量,。ul[(varname|#)] :右刪失變量,。vce(vcetype) :參數(shù)估計(jì)量方差協(xié)方差矩陣一致估計(jì) 格式為: xttobit y x1 x2 x3, ll(#) ul(#) tobit 其中l(wèi)l(#)表示下限,, ul(#) 表示上限,, tobit表示對(duì)原假設(shè)進(jìn)行LR檢驗(yàn)。 webuse nlswork3 xtset idcode xttobit ln_wage union age grade not_smsa south##c.year, ul(1.9) 七.面板工具變量法 面板工具變量法命令為xtivreg webuse nlswork 固定效應(yīng)估計(jì) xtivreg ln_w age c.age#c.age not_smsa (tenure = union south), fe 隨機(jī)效應(yīng)GLS模型 xtivreg ln_w age c.age#c.age not_smsa 2.race (tenure = union birth south), re 八.面板隨機(jī)前沿模型 面板隨機(jī)前沿模型命令為xtfrontier,,語法格式為: xtfrontier depvar [indepvars] [if] [in] [weight] , ti [ti_options] 選項(xiàng) depvar表示被解釋變量,, indepvars表示解釋變量,noconstant 不含截距項(xiàng),。ti :表示估計(jì)技術(shù)效率不隨時(shí)點(diǎn)變化的隨機(jī)效應(yīng)模型,,vce(vcetype) :參數(shù)估計(jì)量方差協(xié)方差矩陣一致估計(jì),tvd表示估計(jì)隨機(jī)效應(yīng)的時(shí)變衰減模型,。 下面以系統(tǒng)自帶的 xtfrontier1數(shù)據(jù)為例進(jìn)行隨機(jī)效應(yīng)模型的分析,,該數(shù)據(jù)變量為machines表示資本,workers 表示勞動(dòng)力,,lnwidgets表示產(chǎn)量對(duì)數(shù),,lnmachines、lnworkers分別表示資產(chǎn)和勞動(dòng)力取完對(duì)數(shù),。 Time-invariant model xtfrontier lnwidgets lnmachines lnworkers, ti Time-varying decay model xtfrontier lnwidgets lnmachines lnworkers, tvd Time-varying decay model with a constraint constraint 1 [eta]_cons = 0 xtfrontier lnwidgets lnmachines lnworkers, tvd constraints(1) |
|