Stata: 輸出regression table到word和excel
1. 安裝estout,。最簡單的方式是在stata的指令輸入: ssc install estout, replace EST安裝的指導(dǎo)網(wǎng)址是:http:///bocode/e/estout/installation.html 2.跑你的regression 3.寫下這行指令esttab using test.rtf,,然后就會(huì)出現(xiàn)個(gè)漂亮的表格給你(WORD文檔),。只要再小幅修改,,就可以直接用了,。這個(gè)檔案會(huì)存在my document\stata下。如果你用打開的是一個(gè)stata do file,,結(jié)果會(huì)保存到do文件所在文件夾中,。如果要得到excel文件,就把后綴改為.xls或者.csv就可以了 4.跑多個(gè)其實(shí)也不難,,只要每跑完一個(gè)regression,,你把它取個(gè)名字存起來:est store m1。m1是你要改的,,第一個(gè)model所以我叫m1,,第二個(gè)的話指令就變成est store m2,依次類推,。 5.運(yùn)行指令:esttab m1 m2 ... using test.rtf就行了,。
異方差的檢驗(yàn):
Breusch-Pagan test in STATA:
其基本命令是:estat hettest var1 var2 var3 其中,var1 var2 var3 分別為你認(rèn)為導(dǎo)致異方差性的幾個(gè)自變量,。是你自己設(shè)定的一個(gè)
滯后項(xiàng)數(shù)量,。
同樣,如果輸出的P-Value 顯著小于0.05,,則拒絕原假設(shè),,即不存在異方差性,。
White檢驗(yàn):
其基本命令是在完成基本的OLS 回歸之后,輸入
imtest,, white 如果輸出的P-Value 顯著小于0.05,,則拒絕原假設(shè),即不存在異方差性
處理異方差性問題的方法:
方法一:WLS
WLS是GLS(一般最小二乘法)的一種,,也可以說在異方差情形下的GLS就是WLS,。在WLS下,我們?cè)O(shè)定擾動(dòng)項(xiàng)的條件方差是某個(gè)解釋變量子集的函數(shù),。之所以被稱為加權(quán)最小二乘法,,是因?yàn)檫@個(gè)估計(jì)最小化的是殘差的加權(quán)平方和,而上述函數(shù)的倒數(shù)恰為其權(quán)重,。
在stata中實(shí)現(xiàn)WLS的方法如下:
reg (被解釋變量) (解釋變量1) (解釋變量2)…… [aweight=變量名]
其中,,aweight后面的變量就是權(quán)重,是我們?cè)O(shè)定的函數(shù),。
一種經(jīng)常的設(shè)定是假設(shè)擾動(dòng)項(xiàng)的條件方差是所有解釋變量的某個(gè)線性組合的指數(shù)函數(shù),。在stata中也可以方便地實(shí)現(xiàn):
首先做標(biāo)準(zhǔn)的OLS回歸,并得到殘差項(xiàng),;
reg (被解釋變量) (解釋變量1) (解釋變量2)…… predict r, resid
生成新變量logusq,,并用它對(duì)所有解釋變量做回歸,得到這個(gè)回歸的擬合值,,再對(duì)這個(gè)擬合值求指數(shù)函數(shù),;
gen logusq=ln(r^2) reg logusq (解釋變量1) (解釋變量2)…… predict g, xb gen h=exp(g)
最后以h作為權(quán)重做WLS回歸,;
reg (被解釋變量) (解釋變量1) (解釋變量2)…… [aweight=h]
如果我們確切地知道擾動(dòng)項(xiàng)的協(xié)方差矩陣的形式,,那么GLS估計(jì)是最小方差線性無偏估計(jì),是所有線性估計(jì)中最好的,。顯然它比OLS更有效率,。雖然GLS有很多好處,但有一個(gè)致命弱點(diǎn):就是一般而言我們不知道擾動(dòng)項(xiàng)的協(xié)方差矩陣,,因而無法保證結(jié)果的有效性,。
方法二:HC SE
There are 3 kinds of HC SE
(1)Huber-White Robust Standard Errors HC1, 其基本命令是:
reg var1 var2 var3, robust
White(1980)證明了這種方法得到的標(biāo)準(zhǔn)誤是漸進(jìn)可用(asymptotically valid)的,。這種方法的優(yōu)點(diǎn)是簡單,,而且需要的信息少,在各種情況下都通用,。缺點(diǎn)是損失了一些效率,。這種方法在我們?nèi)粘5膶?shí)證研究中是最經(jīng)常使用。
(2)MacKinnon-White SE HC2,,其基本命令是:
reg var1 var2 var3, hc2
(3)Long-Ervin SE HC3,,其基本命令是:
reg var1 var2 var3, hc3
約束條件檢驗(yàn):
如果需要檢驗(yàn)兩個(gè)變量,,比如x 與y,之間系
數(shù)之間的關(guān)系,,以檢驗(yàn)兩者系數(shù)相等為例,,我們可以直接輸入命令:
test x=y
再如檢驗(yàn)兩者系數(shù)之和等于1,我們可以直接輸入命令:
test x+y=1
如果輸出結(jié)果對(duì)應(yīng)的P-Value 小于0.05,,則說明原假設(shè)顯著不成立,,即拒絕原假設(shè)。
序列相關(guān)性問題的檢驗(yàn)與處理 序列相關(guān)性問題的檢驗(yàn): 首先,,要保證所用的數(shù)據(jù)必須為時(shí)間序列數(shù)據(jù),。如果原數(shù)據(jù)不是時(shí)間序列數(shù)據(jù), 則需要進(jìn)行必要的處理,,最常用的方法就是: gen n=_n tsset n 這兩個(gè)命令的意思是,,首先要生成一個(gè)時(shí)間序列的標(biāo)志變量n(或者t 也可以); 然后通過tsset 命令將這個(gè)數(shù)據(jù)集定義為依據(jù)時(shí)間序列標(biāo)志變量n定義的時(shí)間序
列數(shù)據(jù),。 最直觀的檢驗(yàn)方式是通過觀察殘差分布,,其基本步驟是在跑完回歸之后,直接輸 入 Predict error, stdp 這樣就得到了殘差值,;然后輸入命令: plot error n 會(huì)得到一個(gè)error 隨n 變化的一個(gè)散點(diǎn)圖,。
D-W檢驗(yàn)——對(duì)一階自相關(guān)問題的檢驗(yàn): D-W檢驗(yàn)是對(duì)一階自相關(guān)問題的常用檢驗(yàn)方法,但是如果實(shí)際問題中存在高階 序列相關(guān)性問題,,則不能用這個(gè)檢驗(yàn)方法,。 D-W 檢驗(yàn)的命令如下: 首先,輸入回歸命令,, reg Variable1 Variable2 Variable3…VariableM 輸出一個(gè)簡單的OLS估計(jì)結(jié)果,。然后,再輸入命令:
dwstat 這時(shí)會(huì)輸出一個(gè)DW 統(tǒng)計(jì)量,。通過與臨界值之間的比較,,可以得出結(jié)論。也可 以執(zhí)行如下命令
estat durbinalt
直接進(jìn)行Durbin檢驗(yàn),。 Breusch-GodfreyTest in STATA——檢驗(yàn)高階序列相關(guān)性: 在得到一個(gè)基本回歸結(jié)果和error 之后,,我們假設(shè)這樣一個(gè)關(guān)系: et = α0 + α1 et-1 + α2 et-2 …+ αk et-p + β1 x1t + β2 x2t … +βk xkt +εt BG 檢驗(yàn)的原假設(shè)是:H0 : α1 = α2 = … αp =0。 其基本命令是: bgodfrey , lags(p) 其中p 是你自己設(shè)定的一個(gè)滯后項(xiàng)數(shù)量,。如果輸出的p-value 顯著小于0.05,,則 可以拒絕原假設(shè),這就意味著模型存在p 階序列相關(guān)性,;如果輸出的p-value 顯 著大于0.05 甚至很大,,則可以接受原假設(shè),即不存在p 階序列相關(guān)性。
處理序列相關(guān)性問題的方法——GLS: 常用的幾種GLS 方法: (1) Cochrane-Orcutt estimator 和Prais-Winsten estimator 其基本命令是 prais var1 var2 var3, corc (2) Newey-West standard errors 其基本命令是 newey var1 var2 var3, lag(3) 其中,,lag(3)意思是對(duì)三階序列相關(guān)性問題進(jìn)行處理,;如果需要對(duì)p 階序列相
關(guān)性問題進(jìn)行處理,則為lag(p)
t因變量,,g,f,c是自變量,,_26存放了弟26個(gè)觀測值,為需要預(yù)測的值
reg t g f c if _n!=26
點(diǎn)預(yù)測
predict taxpredict if _n==26
均值的區(qū)間預(yù)測
predictnl py=predict(xb),ci(lb ub) l(95)
因變量的區(qū)間預(yù)測
adjust g=117251.9 f=24649.95 c=99.9,stdf ci level(95)
Hausman檢驗(yàn)是檢驗(yàn)內(nèi)生性的最常用的方法,。它是通過比較一致估計(jì)量與有效估計(jì)量的Wald統(tǒng)計(jì)量,。 命令格式為:
.hausman name-constistent [name-efficent] [,options]
其中,name-cosistent指一致估計(jì)的結(jié)果,, name-efficent 指有效估計(jì)的結(jié)果,。注意,一致,、有效估計(jì)量的先后順序不能改變,。
Option選項(xiàng):
constant 計(jì)算檢驗(yàn)統(tǒng)計(jì)量將常數(shù)也包括在內(nèi),默認(rèn)值為排除常數(shù) allegs 利用所有方程進(jìn)行檢驗(yàn),,默認(rèn)只對(duì)第一個(gè)方程進(jìn)行檢驗(yàn) skipeqs(eqlist) eqlist只能以方程名稱而不能以方程序號(hào)表示 equation(matchlist) 比較設(shè)定的方程,。 force 即使假設(shè)條件不滿足仍進(jìn)行檢驗(yàn) df(#) 默認(rèn)值為一致估計(jì)與有效估計(jì)的協(xié)方差矩陣的差的估計(jì) sigmamore 協(xié)方差矩陣采用有效估計(jì)量的協(xié)方差矩陣 sigmaless 協(xié)方差矩陣采用一致估計(jì)量的協(xié)方差矩陣 tconsistent(string) 一致估計(jì)量的標(biāo)題 tefficient(string) 有效估計(jì)量的標(biāo)題
工具變量估計(jì) 命令格式: .ivregress esitimator depvar [varlist1] [varlist2=varlist_iv] [if] [in] [weight][,options] 其中,estimator包括2sls,gmm,liml三種,。varlist1為模型中的外生變量,,varlist2為模型中的內(nèi)生變量,varlist_iv為模型中的工具變量,。
Nonconstant 不包括常數(shù)項(xiàng) Hascons 用戶自己設(shè)定常數(shù)項(xiàng) CMM 選項(xiàng): wmatrix(wmtype) robust,cluster clustvar,hac kernel, unadjusted center 權(quán)數(shù)矩陣采用中心矩 igmm 采用迭代GMM估計(jì) eps(#) 參數(shù)收斂標(biāo)準(zhǔn),。默認(rèn)值為eps(le-6) weps(#) 權(quán)數(shù)矩陣的收斂標(biāo)準(zhǔn)。默認(rèn)值為w eps(le-6) Vce(vcetype) unajusted,robust,cluster clustvar,bootstrap,jackknife,hac kernel level(#)置信區(qū)間 First 輸出第一階段的估計(jì)結(jié)果 Small 小樣本下的自由度調(diào)整
.estat firststage [,all forcenonrobust]
該命令給出第一階段的估計(jì)結(jié)果以及各種統(tǒng)計(jì)量,,包括排除外生變量的相關(guān)性檢驗(yàn),。All選項(xiàng)給出所有的擬合優(yōu)度統(tǒng)計(jì)量。如果模型存在多個(gè)內(nèi)生變量,,則stata給出R2,、偏R2、調(diào)整的R2 ,、F統(tǒng)計(jì)量;如果模型存在多個(gè)內(nèi)生變量,,則stata給出Shea偏R2和調(diào)整的偏R2,。 forcenonrobust給出最小特征值統(tǒng)計(jì)量及其臨界值,即使采用穩(wěn)健估計(jì)(這一檢驗(yàn)的假設(shè)條件是誤差項(xiàng)為獨(dú)立正態(tài)分布),。
estat overid[,lag(#) forceweights forcenonrobust] 該命令給出了過度識(shí)別約束檢驗(yàn),。如果使用2sls估計(jì)估計(jì),則Stata給Sargan’s(1958)和Basman’s(1960)卡方統(tǒng)計(jì)量,這也是Wooldridge’(1995)穩(wěn)健得分檢驗(yàn),。如果采用liml估計(jì)方法,,則stata給出Anderson and Rubin’s(1950) 卡方統(tǒng)計(jì)量以及Basmann F統(tǒng)計(jì)量;如果采用GMM估計(jì),,則stata給出hansen’s(1982)J統(tǒng)計(jì)量,。Lags(#)用于計(jì)算得分檢驗(yàn)的HAC(異方差自相關(guān)一致)統(tǒng)計(jì)量的過程中進(jìn)行去噪時(shí)設(shè)定滯后階數(shù)。如果設(shè)定lag(0),則表示不進(jìn)行去噪處理,。默認(rèn)選擇為lag(1),。這一選擇僅使用于2sls估計(jì)方法和設(shè)定vce(hac)選項(xiàng)情況。 Forceweight 表示即使采用aweights,pweights或iweights也進(jìn)行檢驗(yàn),。Stata僅對(duì)于fweights的情況進(jìn)行檢驗(yàn),,其他權(quán)數(shù)所得到臨界值可能不準(zhǔn)確。
Forcenonrobust 指在2sls或LIML估計(jì)中即使采用穩(wěn)健標(biāo)準(zhǔn)差也進(jìn)行Sargan and Basmann檢驗(yàn)(這一檢驗(yàn)的假設(shè)的假設(shè)條件是誤差項(xiàng)為獨(dú)立正態(tài)分布),。
例子:
log(wage)=a+b*educ+c*exper+d*expersq+u
懷疑模型教育(educ)具有內(nèi)生性問題,,利用父母接受教育的年數(shù)(fatheduc,motheduc)作educ的工具變量估計(jì)上述模型。 (1)利用2SLS估計(jì)模型 .ivregress 2sls lwage exper expersq (educ=fatheduc motheduc),first
第一階段回歸結(jié)果為: educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper (21.34) (5.62) (4.39) (1.12) - 0.001expersq (-0.84) 第二階段的估計(jì)結(jié)果為: lwagehat=0.05+0.06educ+0.04exper-0.001expersq (0.12) (1.95) (5.29) (-2.24)
(2)檢驗(yàn)educ的內(nèi)生性 .quietly ivreg iwage exper expersq {educ=fatheduc motheduc} .est store IV_reg .quietly regress lwage exper expersq educ .est store LS_reg .hausman IV_reg LS_reg 可以得到hausman估計(jì)量=2.7,,P值=0.44,。接受原假設(shè),即educ是外生的,。
(3)進(jìn)行過度識(shí)別的約束檢驗(yàn) .estat overid 可得Sargan統(tǒng)計(jì)量=0.38,,P值=0.54接受原假設(shè)。
面板數(shù)據(jù)估計(jì)
首先對(duì)面板數(shù)據(jù)進(jìn)行聲明: 前面是截面單元,,后面是時(shí)間標(biāo)識(shí): tsset company year tsset industry year 產(chǎn)生新的變量:gen newvar=human*lnrd 產(chǎn)生滯后變量Gen fiscal(2)=L2.fiscal 產(chǎn)生差分變量Gen fiscal(D)=D.fiscal
描述性統(tǒng)計(jì): xtdes :對(duì)Panel Data截面?zhèn)€數(shù),、時(shí)間跨度的整體描述 Xtsum:分組內(nèi)、組間和樣本整體計(jì)算各個(gè)變量的基本統(tǒng)計(jì)量 xttab 采用列表的方式顯示某個(gè)變量的分布
Stata中用于估計(jì)面板模型的主要命令:xtreg xtreg depvar [varlist] [if exp] , model_type [level(#) ]
Model type 模型 be Between-effects estimator fe Fixed-effects estimator re GLS Random-effects estimator pa GEE population-averaged estimator mle Maximum-likelihood Random-effects estimator
主要估計(jì)方法: xtreg: Fixed-, between- and random-effects, and population-averaged linear models xtregar:Fixed- and random-effects linear models with an AR(1) disturbance xtpcse :OLS or Prais-Winsten models with panel-corrected standard errors xtrchh :Hildreth-Houck random coefficients models xtivreg :Instrumental variables and two-stage least squares for panel-data models
xtabond:Arellano-Bond linear, dynamic panel data estimator xttobit :Random-effects tobit models xtlogit : Fixed-effects, random-effects, population-averaged logit models xtprobit :Random-effects and population-averaged probit models xtfrontier :Stochastic frontier models for panel-data xtrc gdp invest culture edu sci health social admin,beta
xtreg命令的應(yīng)用: 聲明面板數(shù)據(jù)類型:tsset sheng t 描述性統(tǒng)計(jì):xtsum gdp invest sci admin 1.固定效應(yīng)模型估計(jì): xtreg gdp invest culture sci health admin techno,fe 固定效應(yīng)模型中個(gè)體效應(yīng)和隨機(jī)干擾項(xiàng)的方差估計(jì)值(分別為sigma u 和sigma e),,二者之間的相關(guān)關(guān)系(rho) 最后一行給出了檢驗(yàn)固定效應(yīng)是否顯著的F 統(tǒng)計(jì)量和相應(yīng)的P 值
2.隨機(jī)效應(yīng)模型估計(jì): xtreg gdp invest culture sci health admin techno,re 檢驗(yàn)隨機(jī)效應(yīng)模型是否優(yōu)于混合OLS 模型: 在進(jìn)行隨機(jī)效應(yīng)回歸之后,,使用xttest0 檢驗(yàn)得到的P 值為0.0000,表明隨機(jī)效應(yīng)模型優(yōu)于混合OLS 模型 3. 最大似然估計(jì)Ml: xtreg gdp invest culture sci health admin techno,mle
Hausman檢驗(yàn) Hausman檢驗(yàn)究竟選擇固定效應(yīng)模型還是隨機(jī)效應(yīng)模型: 第一步:估計(jì)固定效應(yīng)模型,,存儲(chǔ)結(jié)果 xtreg gdp invest culture sci health admin techno,fe est store fe 第二步:估計(jì)隨機(jī)效應(yīng)模型,,存儲(chǔ)結(jié)果 xtreg gdp invest culture sci health admin techno,re est store re 第三步:進(jìn)行hausman檢驗(yàn) hausman fe Hausman檢驗(yàn)量為: H=(b-B)′[Var(b)-Var(B)]-1(b-B)~x2(k) Hausman統(tǒng)計(jì)量服從自由度為k的χ2分布。當(dāng)H大于一定顯著水平的臨界值時(shí),,我們就認(rèn)為模型中存在固定效應(yīng),,從而選用固定效應(yīng)模型,否則選用隨機(jī)效應(yīng)模型 如果hausman檢驗(yàn)值為負(fù),,說明的模型設(shè)定有問題,,導(dǎo)致Hausman 檢驗(yàn)的基本假設(shè)得不到滿足,遺漏變量的問題,,或者某些變量是非平穩(wěn)等等 可以改用hausman檢驗(yàn)的其他形式: hausman fe, sigmaless
對(duì)于固定效應(yīng)模型的異方差檢驗(yàn)和序列相關(guān)檢驗(yàn): Xtserial gdp invest culture sci health admin techno 異方差檢驗(yàn): xtreg gdp invest culture sci health admin techno,fe xttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model)
隨機(jī)效應(yīng)模型的序列相關(guān)檢驗(yàn): xtreg gdp invest culture sci health admin techno,re Xttest1 Xttest1用于檢驗(yàn)隨機(jī)效應(yīng)(單尾和雙尾) ,、一階序列相關(guān)以及兩者的聯(lián)合顯著 檢驗(yàn)結(jié)果表明存在隨機(jī)效應(yīng)和序列相關(guān),,而且對(duì)隨機(jī)效應(yīng)和序列相關(guān)的聯(lián)合檢驗(yàn)也非常顯著 可以使用廣義線性模型xtgls對(duì)異方差和序列相關(guān)進(jìn)行修正: xtgls gdp invest culture sci health admin techno, panels(hetero),修正異方差 xtgls gdp invest culture sci health admin techno, panels(correlated),,修正依橫截面而變化的異方差 xtgls gdp invest culture sci health admin techno, panels(hetero) corr(ar1),,修正異方差和一階序列相關(guān)ar(1)
|