《正文》 當(dāng)你看這篇文章的時候,,先參看一下《IV和GMM相關(guān)估計步驟,,內(nèi)生性、異方差性等檢驗方法》,,里面有圈友提議詳細(xì)做一期動態(tài)面板命令方面的,,所以咱們就敲定了這篇工具類型文章。當(dāng)然這篇文章不僅僅講解了xtabond2,,還有xtabond,,xtdpdsys,xtdpd和xtdpdml這些動態(tài)面板Stata命令,。只不過xtabond2可以涵蓋其他類型命令,,所以我們就著重解析了xtabond2。 xtabond2總體而言,,在設(shè)計思路上可以取代xtabond(difference GMM)和xtdpdsys(System GMM),,因為他的語法更加靈活和復(fù)雜一些,可以通過設(shè)置參數(shù)來做前面這兩個動態(tài)面板回歸的操作,。這些動態(tài)面板回歸都尤其適用于那些N比較大,,T比較小的數(shù)據(jù)中。不過他們這三個的具體執(zhí)行步驟是不同的,。 A problem with the original Arellano-Bond estimator is that lagged levels are poor instruments for first differences if the variables are close to a random walk(xtabond使用的工具變量有時候表現(xiàn)很不好). Arellano and Bover (1995) describe how, if the original equation in levels is added to the system, additional instruments can be brought to bear to increase efficiency. In this equation, variables in levels are instrumented with suitable lags of their own first differences(然后xtdpdsys就改進了工具變量的選擇方式,,不僅包括levels還有differences).The assumption needed is that these differences are uncorrelated with the unobserved country effects(要求假定這些differenced過后的工具變量與不可見的個體效應(yīng)不相關(guān)). Blundell and Bond show that this assumption in turn depends on a more precise one about initial conditions. xtabond2的語法格式: xtabond2 depvar(因變量) varlist(系列解釋變量:前置變量、嚴(yán)格外生變量,、內(nèi)生變量) [條件篩選] [回歸區(qū)間][, level(置信區(qū)間) twostep(表明計算two step估計量而不是one step估計量) robust(如果前面選擇了twostep,,那么就必須選擇這個robust) cluster(用來重新命名Panel變量,,就是說改變之前的id) noconstant(在level equations中不要常數(shù)項) small(用t統(tǒng)計量和F統(tǒng)計量,,而不是用z統(tǒng)計量和Wald統(tǒng)計量來評估回歸顯著性) noleveleq(如果有這個命令,那工具變量中就只有difference equations,,沒有了level equations,,因此就等同于做了difference GMM) orthogonal gmmopt [gmmopt ...] ivopt [ivopt ...] pca components(主成分部分) artests(自相關(guān)檢驗的最大階數(shù)) arlevels(標(biāo)明自相關(guān)檢驗用于level equations) h(這個選項一般不影響大局) ] 上面的gmmopt指的是,, gmmstyle(varlist [, laglimits(對于transformed或者level equations,這個選項規(guī)定了工具變量選擇的前后日期) collapse(只為每個變量和滯后距離創(chuàng)造一個工具變量,,而不是每一個時間段都創(chuàng)造一個工具變量,,減少了工具變量個數(shù)) orthogonal(這是用向后orthogonal deviations方法來創(chuàng)造工具變量,主要是與difference GMM連著用,,比傳統(tǒng)的AR(1)difference GMM更加穩(wěn)定無偏) equation({diff | level | both}) passthru split(僅僅用于system GMM和沒有規(guī)定equation(),,主要是把工具變量分成2組來做difference-in-Sargan/Hansen testing)]) 上面ivopt指的是,ivstyle(varlist [, equation({diff | level | both}(表示哪個equation用前面的那個工具變量)) passthru (這個命令在equation(diff)和nolevelleq用了之后使用)mz(工具變量中Missing值就換成0)])#注意的是,,如果x變量是個前置變量,,那作為level equation的工具變量是可以的,但是現(xiàn)在就不能用ivstyle選項,,而是后面這個iv(x, eq(level)),。 On balanced panels, GMM estimators based on the two transforms return numerically identical coefficient estimates, holding the instrument set fixed (Arellano and Bover 1995). But orthogonal deviations has the virtue of preserving sample size in panels with gaps. If some e_it is missing, for example, neither D.e_it nor D.e_i,t+1 can be computed(xtabond2在MATA程序中是用forward orthogonal deviations方法來消除固定個體效應(yīng),即一個第t期的變量減去t期之后所有日期的平均數(shù)值,,這與我們時常用的first difference不太一樣,,因為這種方式保證不了所有日期都能夠獲得數(shù)值)。 Autocorrelation indicates that lags of the dependent variable (and any other variables used as instruments that are not strictly exogenous), are in fact endogenous, thus bad instruments(xtabond2會報告自相關(guān)檢驗情況,,如果有自相關(guān)情況,,那表明這些工具變量并不好). For example, if there is AR(s), then y_i,t-s would be correlated with e_i,t-s, which would be correlated with D.e_i,t-s, which would be correlated with D.e_i,t. So for one-step, robust estimation (and for all two-step estimation), xtabond2 also reports the Hansen J statistic, which is the minimized value of the two-step GMM criterion function, and is robust. xtabond2 still reports the Sargan statistic in these cases because the J test has its own problem: it can be greatly weakened by instrument proliferation (xtabond2會報告Hansen J統(tǒng)計指標(biāo)和Sargan指標(biāo)來檢驗過度識別問題)。 To compensate, xtabond2 makes available a finite-sample correction to the two-step covariance matrix derived by Windmeijer (2005). This can make two-step robust estimations more efficient than one-step robust, especially for system GMM (xtabond2反正用了一些方式讓他的回歸更加有效率和穩(wěn)?。?。 Xtabond2操作示例: GMM估計包括一步(One-Step)和兩步(Two-Step)的GMM。兩步估計的權(quán)重矩陣依賴于估計參數(shù)且標(biāo)準(zhǔn)差存在向下偏倚,,并沒有帶來多大的效率改善且估計量不可靠,,一步估計量盡管效率有所下降但它是一致的,因而在經(jīng)驗應(yīng)用中人們通常使用一步GMM估計,。理論上,,一步系統(tǒng)廣義矩估計(One-StepSystemGMM)利用了比一步差分廣義矩估計(One-stepDifference-GMM)更多的信息,前者可以解決后者不能解決的內(nèi)生性和弱工具變量問題,,因而前者比后者的估計結(jié)果更有效,。Blundell and Bond利用蒙特卡羅模擬實驗也證實,在有限樣本下,,系統(tǒng)GMM比差分GMM估計的偏差更小,、效率也有所改進。 >use http://www./data/r7/abdata.dta >xtabond2 n l.n l(0/1).(w k) yr1980-yr1984, gmm(l.n w k) iv(yr1980-yr1984, passthru) noleveleq small 是檢驗擾動項的差分是否存在一階與二階自相關(guān),,以保證GMM的一致估計,,一般而言擾動項的差分會存在一階自相關(guān),因為是動態(tài)面板數(shù)據(jù),,但若不存在二階自相關(guān)或更高階的自相關(guān),,則接受原假設(shè)“擾動項無自相關(guān)”,。 Arrellano-Bond test for AR(1/2) in first differences,是檢驗擾動項的差分是否存在一階與二階自相關(guān),,以保證GMM的一致估計,,一般而言擾動項的差分會存在一階自相關(guān),因為是動態(tài)面板數(shù)據(jù),,但若不存在二階自相關(guān)或更高階的自相關(guān),,則接受原假設(shè)“擾動項無自相關(guān)”。 對于最下面的這些Sargan test of overid. restrictions和Difference-in-Sargan tests of exogeneity of instrument subsets,,原假設(shè)是這些instruments valid,, 因此p不顯著,不reject原假設(shè)就是好的具體見這篇文章Roodman 2008 revised Note on too many instruments.pdf.pdf 兩步GMM會嚴(yán)重低估回歸系數(shù)的標(biāo)準(zhǔn)誤差,;當(dāng)標(biāo)準(zhǔn)誤差很小的時候,,回歸系數(shù)的顯著性檢驗當(dāng)然是拒絕的(例如p<0.05)。所以當(dāng)兩步GMM沒有糾正這個偏差的時候,,通常得到的回歸系數(shù)都是非常顯著的(例如p<0.01或者p<0.001),。 > xtabond2 n l.n l(0/1).(w k) yr1980-yr1984, gmm(l.n w k) iv(yr1980-yr1984, mz) robust twostep small h(2) 以上的Sargan檢驗拒絕了overidentification restrictions,但是Hansen檢驗失敗拒絕overidentification restrictions,,可能是因為Hansen檢驗比Sargan檢驗更穩(wěn)健,。例如,在異方差情況下,,Sargan檢驗不具有卡方分布,,但是Hansen檢驗卻具有卡方分布,因此如果這個問題出現(xiàn)了,,那Sargan可能錯誤地拒絕原假設(shè),。不過,像這種有很多工具變量的估計,,其他的問題也完全可能出現(xiàn),,從而導(dǎo)致上面的結(jié)果出現(xiàn)。 關(guān)于工具變量的選擇問題,,可以看看下方的合并圖,,一個是以differenced equations作為工具變量,另一個是以level equations作為工具變量。 > xtabond2 n L.n L(0/1).(w k) yr1978-yr1984, gmm(L.(w k n), collapse) iv(yr1978-yr1984, eq(level)) h(2) robust twostep ##通過collapse選項,,我們減少了工具變量的數(shù)目,這樣有利于做諸如overidentification 檢驗,。 > xtabond2 n w cap [pw=_n], iv(cap k ys, eq(level)) iv(rec, eq(level)) cluster(id year) h(1) # Cluster主要考慮組內(nèi)(比如以id為組,,year為組)相關(guān)問題。 1. with cluster 2. without cluster xtabond2是默認(rèn)把ivstyle里面的變量都取滯后項同時作為差分,、水平方程的工具變量,;xtdpdsys默認(rèn)只用于差分方程,并且,,xtdpdsys將沒有設(shè)定為內(nèi)生或先決變量的都自動作為外生變量,,將其滯后項用作工具變量估計差分方程; xtabond2中可以有一部分在前面的回歸變量中列出,,但既不列入gmmstyle,,也不列入ivstyle,這樣就不參與差分和水平方程的估計了(主要是一些滯后項),。 xtdpd的靈活性基本跟xtabond2一樣,,但更加簡潔,就是可以直接,、分別地設(shè)定差分估計和水平估計中采用gmm形式(一個多列矩陣)和iv形式(一個包含自身滯后的列向量)的變量,。 >webuse abdata, clear >xtabond2 n L.n, gmm(n, laglimits(2 .)) small h(2) 用xtabond2做了一個與xtdpd相同的回歸,不過xtabond2報告的檢驗更多,,而xtdpd需要通過下一步estab來做檢驗,。 下面我們用xtdpd也可以得到一樣的回歸結(jié)果,請看劃線部分與上圖對比,。 > xtdpd n L.n, dgmm(n, lagrange(2 .)) lgmm(n, lag(1)) vce(r) 還想要介紹一個類似的動態(tài)面板回歸命令xtdpdml(似然法估計的) Paul Allison, Enrique Moral-Benito, and Richard Williams are currently working on a project entitled 'Dynamic Panel Data Modeling using Maximum Likelihood.' Panel data have many advantages when trying to make causal inferences but can also be difficult to work with. We show that ML provides an alternative to widely used GMM methods such as Arellano-Bond and is superior in many cases. We have prepared a Stata command called xtdpdml that greatly simplifies the process of estimating our models. 《END》 寫在后面:各位圈友,,一個等待數(shù)日的好消息,是計量經(jīng)濟圈應(yīng)圈友提議,,09月04日創(chuàng)建了“計量經(jīng)濟圈的圈子”知識分享社群,,如果你對計量感興趣,并且考慮加入咱們這個計量圈子來受益彼此,,那看看這篇介紹文章和操作步驟哦(戳這里),。加入社群之后一定要看“群公告”,不然接收不了群信息,。 |
|