簡(jiǎn)單線性回歸也稱(chēng)為一元線性回歸,也就是回歸模型中只含一個(gè)自變量,,否則稱(chēng)為多重線性回歸,。簡(jiǎn)單線性回歸模型為: Y= a bX ε 式中,Y——因變量,; X——自變量,; a——常數(shù)項(xiàng),是回歸直線在縱坐標(biāo)軸上的截距,; b——回歸系數(shù),,是回歸直線的斜率; ε——隨機(jī)誤差,即隨機(jī)因素對(duì)因變量所產(chǎn)生的影響,。 以“企業(yè)季度數(shù)據(jù)”為例,,先撇開(kāi)其他費(fèi)用因素,只考慮推廣費(fèi)用對(duì)銷(xiāo)售額的影響,,如果確定了2012年第3季度推廣費(fèi)用預(yù)算,,通過(guò)以上數(shù)據(jù),如何預(yù)測(cè)2012年第3季度銷(xiāo)售額呢,? 1,、繪制散點(diǎn)圖 確定好因變量和自變量后,我們需繪制銷(xiāo)售額(Y)與推廣費(fèi)用(X1)的散點(diǎn)圖,。 STEP 01 單擊【插入】選項(xiàng)卡【圖表】組中的【散點(diǎn)圖】,,選擇【僅帶數(shù)據(jù)標(biāo)記的散點(diǎn)圖】。 STEP 02 彈出一張空白圖表,,選中該【圖表】,,單擊鼠標(biāo)右鍵,在彈出的下拉框中選擇【選擇數(shù)據(jù)】,。 STEP 03 在彈出的【選擇數(shù)據(jù)源】對(duì)話框中,,單擊【添加】按鈕,依次在【X軸序列值(X)】輸入“=企業(yè)季度數(shù)據(jù)!C3:C48”,,在【Y軸序列值(Y)】輸入“=企業(yè)季度數(shù)據(jù)!B3:B48”,。 STEP 04 單擊【確定】按鈕,完成散點(diǎn)圖繪制,,如圖所示,。 從這個(gè)圖中,能夠直觀地看出推廣費(fèi)用與銷(xiāo)售額之間有一定的線性分布特征,,我們還可以利用Excel圖表工具為其添加趨勢(shì)線,。 STEP 01 選中圖表中任一數(shù)據(jù)點(diǎn)以選中數(shù)據(jù)系列,單擊【布局】選項(xiàng)卡【分析】組中的【趨勢(shì)線】,,選擇【其他趨勢(shì)線選項(xiàng)】,。 STEP 02 在彈出的【設(shè)置趨勢(shì)線格式】對(duì)話框中,選擇【趨勢(shì)線選項(xiàng)】下的【線性】項(xiàng),,并在對(duì)話框下方分別勾選【顯示公式】,、【顯示R平方值】。 STEP 03 單擊【確定】按鈕,,即可得到擬合直線,。 擬合曲線方程為:Y=1.198X 4361.5,R2 =0.9055,,如圖所示,。 這只是通過(guò)繪圖方式建立回歸分析模型的一個(gè)簡(jiǎn)單做法,,后續(xù)還要進(jìn)一步使用多個(gè)統(tǒng)計(jì)指標(biāo)來(lái)檢驗(yàn),如回歸模型的擬合優(yōu)度檢驗(yàn)(R2),、回歸模型的顯著性檢驗(yàn)(F檢驗(yàn)),、回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))等來(lái)綜合評(píng)估回歸模型的優(yōu)劣,這時(shí)就需要使用Excel分析工具庫(kù)中的——“回歸”分析工具來(lái)實(shí)現(xiàn),。 STEP 01 單擊【數(shù)據(jù)】選項(xiàng)卡【分析】組中的【數(shù)據(jù)分析】按鈕,,在彈出的【數(shù)據(jù)分析】對(duì)話框中,選擇【回歸】,,單擊【確定】按鈕,。 STEP 02 在彈出【回歸】對(duì)話框中,對(duì)各類(lèi)參數(shù)分別進(jìn)行如下設(shè)置,,如圖所示,。 輸入 ① Y值輸入?yún)^(qū)域:輸入需要分析的因變量數(shù)據(jù)區(qū)域,本例因變量區(qū)域?yàn)锽2:B48,。 ② X值輸入?yún)^(qū)域:輸入需要分析的自變量數(shù)據(jù)區(qū)域,,本例自變量區(qū)域?yàn)镃2:C48。 ③ 標(biāo)志:本例勾選【標(biāo)志】,。 ④ 常數(shù)為零:表示該模型屬于嚴(yán)格的正比例模型,,因本例不是,故未勾選【常數(shù)為零】,。 ⑤ 置信度:本例勾選此復(fù)選框,,并輸入“95%”。 輸出選項(xiàng) ① 輸出區(qū)域:本例將結(jié)果輸出至當(dāng)前工作表的F2單元格,。 ② 殘差:指觀測(cè)值與預(yù)測(cè)值(擬合值)之間的差,也稱(chēng)剩余值,,本例勾選【殘差】,。 ③ 標(biāo)準(zhǔn)殘差:指(殘差-殘差的均值)/殘差的標(biāo)準(zhǔn)差,本例勾選【標(biāo)準(zhǔn)殘差】,。 ④ 殘差圖:以回歸模型的自變量為橫坐標(biāo),,以殘差為縱坐標(biāo)繪制的散點(diǎn)圖。若繪制的點(diǎn)都在以0為橫軸的直線上下隨機(jī)散布,,則表示擬合結(jié)果合理,,否則需要重新建模,本例勾選【殘差圖】,。 ⑤ 線性擬合圖:以回歸模型的自變量為橫坐標(biāo),,以因變量及預(yù)測(cè)值為縱坐標(biāo)繪制的散點(diǎn)圖,本例勾選【線性擬合圖】,。 ⑥ 正態(tài)概率圖:以因變量的百分位排名為橫坐標(biāo),,以因變量作為縱坐標(biāo)繪制的散點(diǎn)圖,,本例勾選【正態(tài)概率圖】。 STEP 03 單擊【確定】按鈕,,結(jié)果如圖所示,。 通過(guò)Excel分析工具庫(kù)中的“回歸”分析工具,我們可以了解到更多信息,,如回歸統(tǒng)計(jì)表,、方差分析表、回歸系數(shù)表這三張表就分別用于回歸模型的擬合優(yōu)度檢驗(yàn)(R2),、回歸模型的顯著性檢驗(yàn)(F檢驗(yàn)),、回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))。 2,、回歸統(tǒng)計(jì)表 回歸統(tǒng)計(jì)表用于衡量因變量Y與自變量X之間相關(guān)程度的大小,,以及檢驗(yàn)樣本數(shù)據(jù)點(diǎn)聚集在回歸直線周?chē)拿芗潭龋瑥亩u(píng)價(jià)回歸模型對(duì)樣本數(shù)據(jù)的代表程度,,即回歸模型的擬合效果,,主要包含以下5個(gè)部分。 ① Multiple R:因變量Y與自變量X之間的相關(guān)系數(shù)絕對(duì)值,,本例R=0.9516,,銷(xiāo)售額與推廣費(fèi)用高度正相關(guān)。 ② R Square:判定系數(shù)R2(也稱(chēng)擬合優(yōu)度或決定系數(shù)),,即相關(guān)系數(shù)R的平方,,R2越接近1,表示回歸模型擬合效果越好,。本例R2=0.9055,,回歸模型擬合效果好。 ③ Adjusted R Square:調(diào)整判定系數(shù)Adjusted R2,,僅用于多重線性回歸時(shí)才有意義,,它用于衡量加入其他自變量后模型的擬合程度。 ④ 標(biāo)準(zhǔn)誤差:其實(shí)應(yīng)當(dāng)是剩余標(biāo)準(zhǔn)差(Std. Error of the Estimate),,這是Excel中的一個(gè)Bug,。在對(duì)多個(gè)回歸模型比較擬合程度時(shí),通常會(huì)比較剩余標(biāo)準(zhǔn)差,,此值越小,,說(shuō)明擬合程度越好,本例剩余標(biāo)準(zhǔn)差為526.41,。 ⑤ 觀測(cè)值:用于估計(jì)回歸模型的數(shù)據(jù)個(gè)數(shù)(n),,本例n=46。 2,、方差分析表 方差分析表的主要作用是通過(guò)F檢驗(yàn)來(lái)判斷回歸模型的回歸效果,,即檢驗(yàn)因變量與所有自變量之間的線性關(guān)系是否顯著,,用線性模型來(lái)描述它們之間的關(guān)系是否恰當(dāng)。表中主要有Df(自由度),、SS(誤差平方和),、MS(均方差)、F(F統(tǒng)計(jì)量),、Significance F(P值)五大指標(biāo),,通常我們只需要關(guān)注F、Significance F兩個(gè)指標(biāo),,其中主要參考Significance F,,因?yàn)橛?jì)算出F統(tǒng)計(jì)量,還需要查找統(tǒng)計(jì)表(F分布臨界值表),,并與之進(jìn)行比較才能得出結(jié)果,,而P值可直接與顯著性水平α比較得出結(jié)果。 ① F:F統(tǒng)計(jì)量,,用于衡量變量間線性關(guān)系是否顯著,,本例中F=421.54。 ② Significance F:是在顯著性水平α(常用取值0.01或0.05)下的F的臨界值,,也就是統(tǒng)計(jì)學(xué)中常說(shuō)的P值,。一般我們以此來(lái)衡量檢驗(yàn)結(jié)果是否具有顯著性,如果P值>0.05,,則結(jié)果不具有顯著的統(tǒng)計(jì)學(xué)意義,;如果0.01<P值≤0.05,則結(jié)果具有顯著的統(tǒng)計(jì)學(xué)意義,;如果P值≤0.01,,則結(jié)果具有極其顯著的統(tǒng)計(jì)學(xué)意義。 3,、回歸系數(shù)表 回歸系數(shù)表主要用于回歸模型的描述和回歸系數(shù)的顯著性檢驗(yàn),。回歸系數(shù)的顯著性檢驗(yàn),,即研究回歸模型中的每個(gè)自變量與因變量之間是否存在顯著的線性關(guān)系,也就是研究自變量能否有效地解釋因變量的線性變化,,它們能否保留在線性回歸模型中,。 回歸系數(shù)表(上圖左側(cè)第三個(gè)表)中,第一列的Intercept,、推廣費(fèi)用,,分別為回歸模型中的a(截距)、b(斜率),,對(duì)于大多數(shù)回歸分析來(lái)講,,關(guān)注b要比a重要,;第二列是a和b的值,據(jù)此可以寫(xiě)出回歸模型,;第四,、五列分別是回歸系數(shù)t檢驗(yàn)和相應(yīng)的P值,P值同樣與顯著性水平α進(jìn)行比較,,最后一列是給出的a和b的95%的置信區(qū)間的上下限,。 最終我們得到的銷(xiāo)售額和推廣費(fèi)用的簡(jiǎn)單線性回歸模型為Y=4361.4864 1.1980X,其中判定系數(shù)R2 =0.9055,,回歸模型擬合效果較好,。回歸模型的F檢驗(yàn)與回歸系數(shù)的t檢驗(yàn)相應(yīng)的P值都遠(yuǎn)小于0.01,,具有顯著線性關(guān)系,。綜合來(lái)說(shuō),回歸模型擬合較好,。 我們將制訂的2012年第3季度的推廣預(yù)算值代入回歸模型,,就可以預(yù)測(cè)出2012年第3季度的銷(xiāo)售額。 |
|
來(lái)自: 東西二王 > 《數(shù)據(jù)技術(shù)》