久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

R語言面板數(shù)據(jù)回歸:含時(shí)間固定效應(yīng)混合模型分析交通死亡率,、酒駕法和啤酒稅

 拓端數(shù)據(jù) 2023-10-16 發(fā)布于浙江

全文鏈接:https:///?p=33874

面板數(shù)據(jù)回可以緩解省略變量偏誤的問題,,特別是當(dāng)沒有既與感興趣的回歸變量相關(guān)又與依賴變量相關(guān)的變量信息時(shí),并且這些變量在時(shí)間或?qū)嶓w維度上是恒定的點(diǎn)擊文末“閱讀原文”獲取完整代碼數(shù)據(jù)

相關(guān)視頻

當(dāng)客戶有面板數(shù)據(jù)可用時(shí),,可以使用面板回歸方法來改善多元回歸模型。這是因?yàn)樵谶@種情況下,,多元回歸模型可能會(huì)產(chǎn)生缺乏內(nèi)部有效性的結(jié)果,。

本文涵蓋以下主題:

  • 面板數(shù)據(jù)符號表示

  • 固定效應(yīng)回歸使用時(shí)間和/或?qū)嶓w固定效應(yīng)

  • 在固定效應(yīng)回歸模型中計(jì)算標(biāo)準(zhǔn)誤差

我們使用一個(gè)面板數(shù)據(jù)集,報(bào)告了1982年至1988年期間交通死亡率觀察到的年度記錄,。應(yīng)用分析酒精稅和酒后駕車法律對道路死亡率是否有影響,,如果存在,這些影響有多強(qiáng)烈,。

面板數(shù)據(jù)

有時(shí),,面板數(shù)據(jù)也被稱為縱向數(shù)據(jù),因?yàn)樗鼮闄M截面數(shù)據(jù)添加了時(shí)間維度,。讓我們來看看數(shù)據(jù)集,,通過檢查其結(jié)構(gòu)并列出前幾個(gè)觀測值。

# 載入包和數(shù)據(jù)集
......
# 聲明為面板數(shù)據(jù),。
Fatas <- pdata.frame(Fats,......
c("state", "year"))
# 獲取維度并檢查結(jié)構(gòu)
is.data.frame(Faies)

str(Fates)

# 列出前幾個(gè)觀測值
head(Fataes)

# 總結(jié)變量 'state' 和 'year'
summary(Fatas[, c(1, 2)])

我們發(fā)現(xiàn)該數(shù)據(jù)集包含了336個(gè)關(guān)于34個(gè)變量的觀測,。

示例:交通死亡和酒精稅

我們首先重現(xiàn)圖。為此,,我們使用1982年和1988年的數(shù)據(jù)估計(jì)簡單回歸模型,,建立啤酒稅與交通死亡率之間的關(guān)系,,交通死亡率以每萬人口的死亡人數(shù)表示。然后,,我們繪制數(shù)據(jù)并添加相應(yīng)的估計(jì)回歸函數(shù),。

# 定義死亡率
Fata......
ies$pop * 10000

# 子集數(shù)據(jù)
Fatalities1982 <- subset(Fata......
1988")
# # 使用1982年和1988年的數(shù)據(jù)估計(jì)簡單的回歸模型
fatal1982_mod <- lm(fa......
lities1982)
fatal1988_mod <- lm(fatal_rate ~ beertax, ......
ities1988)

coeftest(fata......
type = "HC1")

coeftest(fatal......
type = "HC1")

 估計(jì)的回歸函數(shù)如下所示:

# 繪制觀測數(shù)據(jù),并添加1982年數(shù)據(jù)的估計(jì)回歸線
plot(x = as.double(Fatalities1982$beertax),
......

col = "steelblue")

abline(fata......


點(diǎn)擊標(biāo)題查閱往期內(nèi)容

R語言用線性混合效應(yīng)(多水平/層次/嵌套)模型分析聲調(diào)高低與禮貌態(tài)度的關(guān)系

左右滑動(dòng)查看更多

01

02

03

04

# 繪制觀測數(shù)據(jù),,并添加1988年數(shù)據(jù)的估計(jì)回歸線
plot(x = as.double(Fatalities1988$beertax),
y = as.double(Fatalities1988$fatal_rate),
......

col = "steelblue")

abline(fatald, lwd = 1.5,col="darkred")
legend("bo......

在這兩個(gè)圖中,,每個(gè)點(diǎn)代表了相應(yīng)年份中給定州的啤酒稅和死亡率的觀測值?;貧w結(jié)果顯示,,無論是在1982年還是1988年,啤酒稅與死亡率呈正相關(guān)關(guān)系,。然而,,這無法解釋不可觀測的因素,這些因素在地區(qū)之間存在差異,,但可以假定在觀測時(shí)間范圍內(nèi)保持不變,,例如人們對酒后駕車的態(tài)度。面板數(shù)據(jù)可以使我們將這些因素保持不變,。

兩個(gè)時(shí)間段的面板數(shù)據(jù):“前后”比較

假設(shè)只有T=2個(gè)時(shí)間段,,即t=1982,1988。這使我們能夠分析從1982年到1988年的死亡率變化的差異,。我們首先考慮人口回歸模型

其中,,Zi表示在時(shí)間上不變的各州特征。對于t=1982和t=1988,,我們有

我們可以通過將1988年和1982年的死亡率差異與啤酒稅差異進(jìn)行回歸,,來消除自變量中的Zi。

接下來,,我們將使用R通過差分?jǐn)?shù)據(jù)估計(jì)回歸,,并繪制估計(jì)的回歸函數(shù),。

# 計(jì)算差異
diff_fatal_rate <- Fata_rate - Faal_rate
......

# 使用差分?jǐn)?shù)據(jù)估計(jì)回歸
fatal_diff_mod <- lm(dif......
C1")

包括截距允許在1982年和1988年之間的時(shí)間內(nèi),,當(dāng)啤酒稅沒有改變時(shí),平均死亡率發(fā)生變化,。

我們得到OLS估計(jì)的回歸函數(shù)

# 繪制差分?jǐn)?shù)據(jù)
plot(x = as.double(diff_beertax),
......

pch = 20,
col = "steelblue")

# 將回歸線添加到圖表中
abline(fata......
red")
# 添加圖例
legend("topri......
)

現(xiàn)估計(jì)的啤酒稅系數(shù)為負(fù),,并且與0顯著不同,在5%的水平上,。

# 計(jì)算所有州在所有時(shí)間段上的平均死亡率
mean(Fata_rate)

再次,,這個(gè)結(jié)果很可能是因?yàn)樵趩文昊貧w中忽略了影響死亡率并與啤酒稅和時(shí)間變化相關(guān)的因素。

固定效應(yīng)回歸

考慮面板回歸模型

其中Zi是實(shí)體i的未觀察到的時(shí)間不變異,,i=1,…,n,。我們的目標(biāo)是估計(jì)β1,,即在保持Zi恒定不變的情況下,Xi對Yi的影響。令αi=β0+β2Zi=β0+β2Zi,,我們得到模型

該模型具有個(gè)體特定的截距αi,,i=1,…,n,其中每一個(gè)可以理解為實(shí)體i的固定效應(yīng),。αi的變化來自Zi,。可以重寫為包含n?1個(gè)虛擬回歸器和一個(gè)常數(shù)項(xiàng)的回歸模型:

模型有n個(gè)不同的截距,,每個(gè)實(shí)體一個(gè),。固定效應(yīng)模型的等價(jià)表示。

固定效應(yīng)模型可以推廣為包含多個(gè)與X相關(guān)并隨時(shí)間變化的Y決定因素,。關(guān)鍵概念介紹了廣義固定效應(yīng)回歸模型,。

應(yīng)用于交通死亡數(shù)據(jù)

根據(jù)關(guān)鍵概念用于估計(jì)交通死亡率與啤酒稅之間關(guān)系的簡單固定效應(yīng)模型是

這是交通死亡率對啤酒稅和48個(gè)二分類回歸的回歸分析。

我們只需使用lm()函數(shù),,即可獲得β1的估計(jì)值,。

fatamod <- lm(fatal_......

fatal_m_mod

如前文所述,我們可以通過對去中心化數(shù)據(jù)應(yīng)用OLS來估計(jì)β1,,即運(yùn)行回歸模型,。

R

# 獲取去中心化數(shù)據(jù)
Fatalianed <- with(Fata......
state)))

# 估計(jì)回歸模型
summary(lm(fatal......
meaned))

ave函數(shù)方便計(jì)算組平均值。我們使用它來獲取每個(gè)州的平均死亡率和啤酒稅,。

lm()類似,,我們需要在plm()的調(diào)用中指定回歸公式和要使用的數(shù)據(jù)。

R

# 使用plm()估計(jì)固定效應(yīng)回歸模型
fatal_fe_mod <- plm(fatal_......


coeftest(fata......
HC1")

估計(jì)的系數(shù)仍為-0.65,。需要注意的是,,plm()使用去中心化OLS算法,因此不報(bào)告虛擬變量的系數(shù),。估計(jì)的回歸函數(shù)為:

啤酒稅的系數(shù)為負(fù)且顯著,。

含時(shí)間固定效應(yīng)的回歸

可以通過包括時(shí)間固定效應(yīng)來控制對實(shí)體而言不變但隨時(shí)間而變的變量。如果僅存在時(shí)間固定效應(yīng),,則固定效應(yīng)回歸模型變?yōu)椋?/p>

因?yàn)槟P桶ń鼐?,所以只包含T-1個(gè)虛擬變量(B1被省略)。該模型消除了由于排除隨時(shí)間但對實(shí)體恒定的未觀測變量而引起的遺漏變量偏差,。

在某些應(yīng)用中,,同時(shí)包括實(shí)體和時(shí)間固定效應(yīng)是有意義的。實(shí)體和時(shí)間固定效應(yīng)模型為:

這種綜合模型能夠消除隨時(shí)間變化但實(shí)體間恒定的不可觀察因素的偏差,,并控制在時(shí)間上不同但實(shí)體間恒定的因素,。可以使用R中實(shí)現(xiàn)的OLS算法估計(jì)此類模型,。

下面的代碼塊展示了如何估計(jì)關(guān)于死亡人數(shù)和啤酒稅之間的關(guān)系的結(jié)合實(shí)體和時(shí)間固定效應(yīng)模型,。

# 估計(jì)一個(gè)包含時(shí)間和實(shí)體固定效應(yīng)的回歸模型

# 通過lm()函數(shù)
fatal_tmod <- lm(fatal_ra......
_mod

# 通過plm()函數(shù)
fatal__mod <- plm(fatal_rate......
s")

coeftest(fata......
HC1")

估計(jì)的回歸函數(shù)為

結(jié)果-0.66接近僅包含實(shí)體固定效應(yīng)的回歸模型的估計(jì)系數(shù),。

我們得出結(jié)論:交通事故死亡人數(shù)與實(shí)際啤酒稅之間的估計(jì)關(guān)系不受由恒定于時(shí)間或州的遺漏變量造成的偏誤的影響。

固定效應(yīng)回歸的假設(shè)和固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差

重點(diǎn)討論實(shí)體固定效應(yīng)模型,,并介紹在OLS產(chǎn)生無偏估計(jì)且大樣本下服從正態(tài)分布所需的模型假設(shè),。這些假設(shè)是多元回歸模型的延伸,并在關(guān)鍵概念中給出,。我們還簡要討論了固定效應(yīng)模型中的標(biāo)準(zhǔn)誤差,,與多元回歸中的標(biāo)準(zhǔn)誤差不同,因?yàn)槊姘迥P椭械幕貧w誤差可以表現(xiàn)出串行相關(guān)性,。

固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差

與異方差性類似,,自相關(guān)也使得通常的標(biāo)準(zhǔn)誤公式以及異方差性-穩(wěn)健標(biāo)準(zhǔn)誤失效,因?yàn)檫@些公式是在沒有自相關(guān)的假設(shè)下推導(dǎo)出來的,。

回歸分析是說明為什么在固定效應(yīng)模型的實(shí)證應(yīng)用中使用聚類標(biāo)準(zhǔn)誤至關(guān)重要的很好例子,。




# 基于異方差性-穩(wěn)健標(biāo)準(zhǔn)誤的摘要
coeftest(fatal......
= "HC1")[1, ]



# 基于聚類標(biāo)準(zhǔn)誤的摘要
coeftest(fata......
pe = "HC1")

結(jié)果有很大的不同:如果不考慮自相關(guān),我們得到一個(gè)標(biāo)準(zhǔn)誤為0.25,,這意味著在5%的顯著性水平上,,對于啤酒稅的系數(shù)^β1^1具有顯著性。相反,,使用聚類標(biāo)準(zhǔn)誤0.35將導(dǎo)致無法拒絕零假設(shè)H0: β1 = 0,,在相同的顯著性水平下。

酒駕法和交通事故死亡

在我們迄今考慮的與交通事故死亡和啤酒稅之間關(guān)系的所有模型中,,存在兩個(gè)主要的遺漏變量偏差來源:經(jīng)濟(jì)狀況和駕駛法規(guī),。

首先,根據(jù)回歸結(jié)果,,我們定義變量,。


# 將最低法定飲酒年齡離散化
Fatalities$drinkagec <- cut(Fatalities$drinkage,
......

right = FALSE)

# 將最低飲酒年齡[21, 22]設(shè)置為基準(zhǔn)水平
Fatalities$drinkagec <- relevel(Fatal......
]")

# 強(qiáng)制監(jiān)禁或社區(qū)服務(wù)?
Fatalities$punish <- with(Fata......
"yes")))

# 所有變量在1982年和1988年的觀測集合

Fat......
, year == 1982 | year == 1988), ]

接下來,,我們使用plm()函數(shù)對所有七個(gè)模型進(jìn)行估計(jì),。

R

# 估計(jì)所有七個(gè)模型
fatalesmod1 <- lm(fa......
ties)

faalite_mod2 <- plm(fata......
ities)

fatiie_od3 <- plm(fatal......


fataits_od4 <- plm(fat......
data = Fatlities)
fatltismod5 <- plm(fat......

data = Faalties)

fatatis_od6 <- plm(fat......

data = Faalites)

fatlie_mod7 <- plm(fat......

data = Fatliie_1982_1988)

生成結(jié)果的綜合表格演示。

R

library(stargazer)

# 將聚類標(biāo)準(zhǔn)誤差收集到一個(gè)列表中
rob_se <- list(sqrt(diag(vcovHC(fatalities_mod1, type = "HC1"))),
......

sqrt(diag(vcovHC(fatalities_mod7, type = "HC1"))))

# 生成表格
stargazer(fatalities_mod1, fatalities_mod2, fatalities_mod3,
......

model.numbers = FALSE,......
", "(7)"))

因變量:死亡率 

模型(5)省略了經(jīng)濟(jì)因素,。結(jié)果支持這樣一種觀點(diǎn),,即啤酒稅的系數(shù)對包括后者在內(nèi)的模型具有敏感性,因此應(yīng)將經(jīng)濟(jì)指標(biāo)保留在模型中,。

模型(6)的結(jié)果表明,,法定飲酒年齡幾乎沒有解釋能力,,而與飲酒年齡和交通事故死亡率之間的關(guān)系的函數(shù)形式的改變也不會(huì)對所關(guān)注的系數(shù)產(chǎn)生影響,。

規(guī)格說明(7)表明,減少可用信息的數(shù)量(我們在這里只使用了1982年至1988年期間的95個(gè)觀測值)會(huì)增加標(biāo)準(zhǔn)誤差,,但對系數(shù)估計(jì)沒有產(chǎn)生 drast 的變化,。

總結(jié)

我們沒有找到證據(jù)表明嚴(yán)厲的懲罰和提高最低飲酒年齡會(huì)降低由酒駕引起的交通事故死亡人數(shù),。然而,酒稅似乎對交通事故死亡率有負(fù)面影響,,但由于估計(jì)的不準(zhǔn)確性,,不能將其解釋為感興趣的因果效應(yīng),因?yàn)槿匀豢赡艽嬖谄?。問題在于可能存在在地區(qū)之間以及隨時(shí)間變化的被忽略的變量,,并且即使我們使用控制實(shí)體特定和時(shí)間不變的不可觀測因素的面板方法,這種偏差仍然存在,。


    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多