做回歸分析時,,有沒有覺得只報一張β系數(shù)和R方的表格不夠高端,?這期咱就把回歸分析的圖表玩出花來。本期用到的數(shù)據(jù)是Stata自帶的示例數(shù)據(jù)auto,,反映了1978年美國不同品牌汽車的交易記錄:品牌(make),、價格(price)、里程數(shù)(mpg),、維修記錄(rep78),、凈空(headroom)、行李箱容積(trunk),、空車質(zhì)量(weight),、車長(length)、發(fā)動機排量(displacement),、齒數(shù)比(gear_ratio)等,;通過“sysuse”調(diào)用Stata自帶數(shù)據(jù):
對于一元線性回歸分析,可以通過在散點圖上添加置信區(qū)間的方式,,來讓結(jié)果更好看,;例如,以“價格(price)”為因變量,,“里程數(shù)(mpg)”為自變量,,分析兩者之間的關(guān)系:
為防止置信區(qū)間“帶狀區(qū)域”蓋住散點,所以我們先繪制置信區(qū)間(lfitci)再點出散點(scatter),;但這個圖還是有兩個問題:如果需要90%的置信水平怎么辦(默認為95%)?需要標(biāo)注各個點的名稱怎么破,?下面就來解決這兩個問題,,先根據(jù)自己的實際需要修改置信水平(stdf level):
再給各個點標(biāo)注(mlabel)名稱:
這種圖示長得有點像“元分析(meta-analysis)”里面的“森林圖(forest plot)”;例如,,以“價格(price)”為因變量,,里程數(shù)(mpg)、維修記錄(rep78),、凈空(headroom),、行李箱容積(trunk)、空車質(zhì)量(weight),、車長(length),、發(fā)動機排量(displacement)、齒數(shù)比(gear_ratio)等為自變量,,分析它們之間的關(guān)系:
這是我們做回歸分析時最常見的報表,,接下來給這張報表做做“美容”,在這之前要先安裝plotbeta命令:
|
|