全文鏈接:https:///?p=33874面板數(shù)據(jù)回歸可以緩解省略變量偏誤的問題,,特別是當(dāng)沒有既與感興趣的回歸變量相關(guān)又與依賴變量相關(guān)的變量信息時(shí),并且這些變量在時(shí)間或?qū)嶓w維度上是恒定的(點(diǎn)擊文末“閱讀原文”獲取完整代碼數(shù)據(jù))。 相關(guān)視頻 當(dāng)客戶有面板數(shù)據(jù)可用時(shí),,可以使用面板回歸方法來改善多元回歸模型。這是因?yàn)樵谶@種情況下,,多元回歸模型可能會(huì)產(chǎn)生缺乏內(nèi)部有效性的結(jié)果,。 本文涵蓋以下主題:
我們使用一個(gè)面板數(shù)據(jù)集,報(bào)告了1982年至1988年期間交通死亡率觀察到的年度記錄,。應(yīng)用分析酒精稅和酒后駕車法律對道路死亡率是否有影響,,如果存在,這些影響有多強(qiáng)烈,。 面板數(shù)據(jù)有時(shí),,面板數(shù)據(jù)也被稱為縱向數(shù)據(jù),因?yàn)樗鼮闄M截面數(shù)據(jù)添加了時(shí)間維度,。讓我們來看看數(shù)據(jù)集,,通過檢查其結(jié)構(gòu)并列出前幾個(gè)觀測值。
我們發(fā)現(xiàn)該數(shù)據(jù)集包含了336個(gè)關(guān)于34個(gè)變量的觀測,。 示例:交通死亡和酒精稅我們首先重現(xiàn)圖。為此,,我們使用1982年和1988年的數(shù)據(jù)估計(jì)簡單回歸模型,,建立啤酒稅與交通死亡率之間的關(guān)系,,交通死亡率以每萬人口的死亡人數(shù)表示。然后,,我們繪制數(shù)據(jù)并添加相應(yīng)的估計(jì)回歸函數(shù),。
估計(jì)的回歸函數(shù)如下所示:
點(diǎn)擊標(biāo)題查閱往期內(nèi)容 R語言用線性混合效應(yīng)(多水平/層次/嵌套)模型分析聲調(diào)高低與禮貌態(tài)度的關(guān)系 左右滑動(dòng)查看更多
在這兩個(gè)圖中,,每個(gè)點(diǎn)代表了相應(yīng)年份中給定州的啤酒稅和死亡率的觀測值?;貧w結(jié)果顯示,,無論是在1982年還是1988年,啤酒稅與死亡率呈正相關(guān)關(guān)系,。然而,,這無法解釋不可觀測的因素,這些因素在地區(qū)之間存在差異,,但可以假定在觀測時(shí)間范圍內(nèi)保持不變,,例如人們對酒后駕車的態(tài)度。面板數(shù)據(jù)可以使我們將這些因素保持不變,。 兩個(gè)時(shí)間段的面板數(shù)據(jù):“前后”比較假設(shè)只有T=2個(gè)時(shí)間段,,即t=1982,1988。這使我們能夠分析從1982年到1988年的死亡率變化的差異,。我們首先考慮人口回歸模型 其中,,Zi表示在時(shí)間上不變的各州特征。對于t=1982和t=1988,,我們有 我們可以通過將1988年和1982年的死亡率差異與啤酒稅差異進(jìn)行回歸,,來消除自變量中的Zi。 接下來,,我們將使用R通過差分?jǐn)?shù)據(jù)估計(jì)回歸,,并繪制估計(jì)的回歸函數(shù),。
包括截距允許在1982年和1988年之間的時(shí)間內(nèi),,當(dāng)啤酒稅沒有改變時(shí),平均死亡率發(fā)生變化,。 我們得到OLS估計(jì)的回歸函數(shù)
現(xiàn)估計(jì)的啤酒稅系數(shù)為負(fù),,并且與0顯著不同,在5%的水平上,。
再次,,這個(gè)結(jié)果很可能是因?yàn)樵趩文昊貧w中忽略了影響死亡率并與啤酒稅和時(shí)間變化相關(guān)的因素。 固定效應(yīng)回歸考慮面板回歸模型 其中Zi是實(shí)體i的未觀察到的時(shí)間不變異,,i=1,…,n,。我們的目標(biāo)是估計(jì)β1,,即在保持Zi恒定不變的情況下,Xi對Yi的影響。令αi=β0+β2Zi=β0+β2Zi,,我們得到模型 該模型具有個(gè)體特定的截距αi,,i=1,…,n,其中每一個(gè)可以理解為實(shí)體i的固定效應(yīng),。αi的變化來自Zi,。可以重寫為包含n?1個(gè)虛擬回歸器和一個(gè)常數(shù)項(xiàng)的回歸模型: 模型有n個(gè)不同的截距,,每個(gè)實(shí)體一個(gè),。固定效應(yīng)模型的等價(jià)表示。 固定效應(yīng)模型可以推廣為包含多個(gè)與X相關(guān)并隨時(shí)間變化的Y決定因素,。關(guān)鍵概念介紹了廣義固定效應(yīng)回歸模型,。 應(yīng)用于交通死亡數(shù)據(jù)根據(jù)關(guān)鍵概念用于估計(jì)交通死亡率與啤酒稅之間關(guān)系的簡單固定效應(yīng)模型是 這是交通死亡率對啤酒稅和48個(gè)二分類回歸的回歸分析。 我們只需使用
如前文所述,我們可以通過對去中心化數(shù)據(jù)應(yīng)用OLS來估計(jì)β1,,即運(yùn)行回歸模型,。
與
估計(jì)的系數(shù)仍為-0.65,。需要注意的是,, 啤酒稅的系數(shù)為負(fù)且顯著,。 含時(shí)間固定效應(yīng)的回歸可以通過包括時(shí)間固定效應(yīng)來控制對實(shí)體而言不變但隨時(shí)間而變的變量。如果僅存在時(shí)間固定效應(yīng),,則固定效應(yīng)回歸模型變?yōu)椋?/p> 因?yàn)槟P桶ń鼐?,所以只包含T-1個(gè)虛擬變量(B1被省略)。該模型消除了由于排除隨時(shí)間但對實(shí)體恒定的未觀測變量而引起的遺漏變量偏差,。 在某些應(yīng)用中,,同時(shí)包括實(shí)體和時(shí)間固定效應(yīng)是有意義的。實(shí)體和時(shí)間固定效應(yīng)模型為: 這種綜合模型能夠消除隨時(shí)間變化但實(shí)體間恒定的不可觀察因素的偏差,,并控制在時(shí)間上不同但實(shí)體間恒定的因素,。可以使用R中實(shí)現(xiàn)的OLS算法估計(jì)此類模型,。 下面的代碼塊展示了如何估計(jì)關(guān)于死亡人數(shù)和啤酒稅之間的關(guān)系的結(jié)合實(shí)體和時(shí)間固定效應(yīng)模型,。
估計(jì)的回歸函數(shù)為 結(jié)果-0.66接近僅包含實(shí)體固定效應(yīng)的回歸模型的估計(jì)系數(shù),。 我們得出結(jié)論:交通事故死亡人數(shù)與實(shí)際啤酒稅之間的估計(jì)關(guān)系不受由恒定于時(shí)間或州的遺漏變量造成的偏誤的影響。 固定效應(yīng)回歸的假設(shè)和固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差重點(diǎn)討論實(shí)體固定效應(yīng)模型,,并介紹在OLS產(chǎn)生無偏估計(jì)且大樣本下服從正態(tài)分布所需的模型假設(shè),。這些假設(shè)是多元回歸模型的延伸,并在關(guān)鍵概念中給出,。我們還簡要討論了固定效應(yīng)模型中的標(biāo)準(zhǔn)誤差,,與多元回歸中的標(biāo)準(zhǔn)誤差不同,因?yàn)槊姘迥P椭械幕貧w誤差可以表現(xiàn)出串行相關(guān)性,。 固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差與異方差性類似,,自相關(guān)也使得通常的標(biāo)準(zhǔn)誤公式以及異方差性-穩(wěn)健標(biāo)準(zhǔn)誤失效,因?yàn)檫@些公式是在沒有自相關(guān)的假設(shè)下推導(dǎo)出來的,。 回歸分析是說明為什么在固定效應(yīng)模型的實(shí)證應(yīng)用中使用聚類標(biāo)準(zhǔn)誤至關(guān)重要的很好例子,。
結(jié)果有很大的不同:如果不考慮自相關(guān),我們得到一個(gè)標(biāo)準(zhǔn)誤為0.25,,這意味著在5%的顯著性水平上,,對于啤酒稅的系數(shù)^β1^1具有顯著性。相反,,使用聚類標(biāo)準(zhǔn)誤0.35將導(dǎo)致無法拒絕零假設(shè)H0: β1 = 0,,在相同的顯著性水平下。 酒駕法和交通事故死亡在我們迄今考慮的與交通事故死亡和啤酒稅之間關(guān)系的所有模型中,,存在兩個(gè)主要的遺漏變量偏差來源:經(jīng)濟(jì)狀況和駕駛法規(guī),。 首先,根據(jù)回歸結(jié)果,,我們定義變量,。
接下來,,我們使用
生成結(jié)果的綜合表格演示。
因變量:死亡率 模型(5)省略了經(jīng)濟(jì)因素,。結(jié)果支持這樣一種觀點(diǎn),,即啤酒稅的系數(shù)對包括后者在內(nèi)的模型具有敏感性,因此應(yīng)將經(jīng)濟(jì)指標(biāo)保留在模型中,。 模型(6)的結(jié)果表明,,法定飲酒年齡幾乎沒有解釋能力,,而與飲酒年齡和交通事故死亡率之間的關(guān)系的函數(shù)形式的改變也不會(huì)對所關(guān)注的系數(shù)產(chǎn)生影響,。 規(guī)格說明(7)表明,減少可用信息的數(shù)量(我們在這里只使用了1982年至1988年期間的95個(gè)觀測值)會(huì)增加標(biāo)準(zhǔn)誤差,,但對系數(shù)估計(jì)沒有產(chǎn)生 drast 的變化,。 總結(jié)我們沒有找到證據(jù)表明嚴(yán)厲的懲罰和提高最低飲酒年齡會(huì)降低由酒駕引起的交通事故死亡人數(shù),。然而,酒稅似乎對交通事故死亡率有負(fù)面影響,,但由于估計(jì)的不準(zhǔn)確性,,不能將其解釋為感興趣的因果效應(yīng),因?yàn)槿匀豢赡艽嬖谄?。問題在于可能存在在地區(qū)之間以及隨時(shí)間變化的被忽略的變量,,并且即使我們使用控制實(shí)體特定和時(shí)間不變的不可觀測因素的面板方法,這種偏差仍然存在,。 |
|