01
引言
導(dǎo)讀:逐步回歸分析是多元回歸分析中的一種方法,,在經(jīng)濟(jì)研究建模中發(fā)揮著重要的作用。文章系統(tǒng)介紹了逐步回歸分析,,并分析了逐步回歸分析在經(jīng)濟(jì)研究(建模與預(yù)測)中的應(yīng)用步驟與需要注意的問題,。 來源 | 統(tǒng)計(jì)與決策 作者丨游士兵,嚴(yán)研,,武漢大學(xué)經(jīng)濟(jì)與管理學(xué)院 原文有刪減 01 引言 逐步回歸分析是多元回歸分析中的一種方法,。回歸分析是用于研究多個(gè)變量之間相互依賴的關(guān)系,,而逐步回歸分析往往用于建立最優(yōu)或合適的回歸模型,,從而更加深入地研究變量之間的依賴關(guān)系。目前,,逐步回歸分析被廣泛應(yīng)用于各個(gè)學(xué)科領(lǐng)域,,如醫(yī)學(xué)、氣象學(xué),、人文科學(xué),、經(jīng)濟(jì)學(xué)等。 經(jīng)濟(jì)現(xiàn)象紛繁復(fù)雜并多變,,經(jīng)濟(jì)問題往往需要研究一個(gè)(或多個(gè))變量(如一國的產(chǎn)出)與其他變量(如資本,、勞動(dòng)力、人口,、技術(shù)等)相互間的關(guān)系,,從而揭示經(jīng)濟(jì)現(xiàn)象背后的經(jīng)濟(jì)規(guī)律,用于解決現(xiàn)實(shí)中的經(jīng)濟(jì)問題,,制定經(jīng)濟(jì)政策等,。因此,多元回歸分析在現(xiàn)代經(jīng)濟(jì)學(xué),,尤其是其分支學(xué)科計(jì)量經(jīng)濟(jì)學(xué)中常常得到應(yīng)用,。隨著統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)軟件的開發(fā)與應(yīng)用,,經(jīng)濟(jì)研究者在經(jīng)濟(jì)學(xué)的實(shí)證分析過程中越來越多的采用逐步回歸分析的方法來建立多元回歸模型。因此,,研究逐步回歸分析及其在經(jīng)濟(jì)學(xué)研究中的應(yīng)用具有理論與實(shí)踐意義,。 目前,國內(nèi)外對(duì)于逐步回歸分析的研究主要停留在理論敘述,,不少學(xué)者提出了修正逐步回歸法的新方法,,如類逐步回歸法、基于單元步的逐步回歸法,、“宜取回歸方程”的逐步回歸法等,。趙希男(1994)提出并在理論上證明可將逐步回歸算法從靜態(tài)系統(tǒng)拓廣到其他系統(tǒng)(動(dòng)態(tài)系統(tǒng)、分布參數(shù)等系統(tǒng)),。傳統(tǒng)的逐步回歸法通常用于靜態(tài)系統(tǒng),,即自變量為非隨機(jī)變量時(shí)。當(dāng)自變量為分布型變量時(shí),,基于傳統(tǒng)的逐步回歸法,,由于統(tǒng)計(jì)量的分布非常復(fù)雜,基于統(tǒng)計(jì)量的算法難以實(shí)現(xiàn),。該文運(yùn)用泛函分析,,按照傳統(tǒng)逐步回歸法一致思想和相似的步驟,加以拓廣,,以有效性(剩余相關(guān)系數(shù))為標(biāo)準(zhǔn)剔除或是引入變量,,從而使得逐步回歸法應(yīng)用范圍更廣。張華嘉,、舒元(1998)提出單元步的概念來修正傳統(tǒng)逐步回歸法,,并以實(shí)例證明這種方法的優(yōu)勢。逐步回歸法的自變量個(gè)數(shù)可能偏小,,而向后回歸法可能納入更多的變量,,同時(shí)帶來多重共線性。為了避免多重共線性并包含更多的變量,,他們分析向后回歸法較逐步回歸法而多余的變量,,以一個(gè)或幾個(gè)變量為一單元步(當(dāng)去掉該單元步中所有變量時(shí)其余變量顯著,而去掉其中某一部分變量,,單元步中剩余的變量總存在不顯著變量)。確定單元步變量之后,,以單元步為整體,,確定是否剔除單元步。陳全潤,、楊翠紅(2008)提出了基于殘差項(xiàng)絕對(duì)值加權(quán)和最小準(zhǔn)則下的回歸估計(jì),,以有效性為指標(biāo)來選擇剔除或是刪除變量的類逐步回歸法,。 而經(jīng)濟(jì)學(xué)者多直接采用這一方法研究各種經(jīng)濟(jì)問題,而忽略這種方法可能存在的問題與局限性,。而且在具體應(yīng)用逐步回歸分析法時(shí),,不同的研究者常采用不同的算法。 逐步回歸法作為建立最優(yōu)線性回歸模型的一種方法,,在經(jīng)濟(jì)研究中也得到廣泛的應(yīng)用,,尤其是在經(jīng)濟(jì)建模與預(yù)測中。因?yàn)橹鸩交貧w法簡單易行,,所得的回歸方程的變量較少,,并保留了影響最顯著的重要變量,而且在實(shí)踐中這種方法也被證明較為有效,,預(yù)測精確度較高,;同時(shí)經(jīng)濟(jì)變量之間往往存在相互關(guān)系,即經(jīng)濟(jì)變量可能存在多重共線性,,而逐步回歸在一定程度上可以修正多重共線性,。 本文將全面、系統(tǒng)地闡釋逐步回歸分析,,從經(jīng)濟(jì)建模與預(yù)測角度進(jìn)行探討,,并說明逐步回歸分析在經(jīng)濟(jì)研究中的具體應(yīng)用、局限性以及可能存在的問題,。 02 逐步回歸分析的基本思想 逐步回歸分析建立于線性回歸模型的基礎(chǔ)上,,本文將以經(jīng)典的多元線性回歸模型為例進(jìn)行闡釋。在建立模型過程中,,需要選擇合適的變量,。如果變量過多,可能會(huì)導(dǎo)致預(yù)測精度下降,,或者有時(shí)收集某些變量的數(shù)據(jù)成本很高,,從而不得不放棄某些變量。當(dāng)然如果影響顯著的變量沒有包括在模型內(nèi),,也會(huì)影響預(yù)測精度,。因此,需要進(jìn)一步解決的問題是建立“最優(yōu)”的回歸方程,,這里“最優(yōu)”的回歸方程,,通常是指模型中包含所有對(duì)因變量 Y 影響顯著的自變量,而不包含對(duì)因變量 Y 影響不顯著的自變量,。建立“最優(yōu)”的回歸方程主要有三種方法,。一種是計(jì)算量很大的全子集法,以某一確定準(zhǔn)則來確定最優(yōu)回歸子集,;另一種是“最優(yōu)”子集的變量篩選法,,該方法基于偏回歸平方和檢驗(yàn)逐步引入變量或是逐步剔除變量或是兩者結(jié)合,,包括向前引入法、向后剔除法與逐步回歸法(即逐步回歸分析),;第三種是計(jì)算量適中的選擇法,。 逐步回歸法可以認(rèn)為是向前引入法與向后剔除法的綜合。逐步回歸法克服了向前引入法與向后剔除法的缺點(diǎn),,吸收兩種方法的優(yōu)點(diǎn),。逐步回歸法是以向前引入為主,變量可進(jìn)可出的變量選取方法,。它的基本思想是,,當(dāng)被選入的變量在新變量引入后變得不重要時(shí),可以將其剔除,,而被剔除的變量當(dāng)它在新變量引入后變得重要時(shí),,又可以重新選入方程。 03 多重共線性與逐步回歸 應(yīng)用逐步回歸法修正多重共線性逐步回歸法用于多重共線性的檢驗(yàn),。逐步回歸法的基本思想是逐個(gè)引入新的變量,。考慮是否引入新的變量時(shí),若偏回歸平方和變化顯著,,則可以引入,,否則不引入。此時(shí),,若偏回歸平方和經(jīng)檢驗(yàn)顯著,,則表明可以認(rèn)為新變量是獨(dú)立的解釋變量,而不可以由其他解釋變量(近似)線性表示,,否則說明新變量不獨(dú)立,。 逐步回歸分析應(yīng)用中應(yīng)注意的問題 建立經(jīng)濟(jì)模型是分析研究經(jīng)濟(jì)問題的一個(gè)有效而常用的途徑。將逐步回歸法應(yīng)用于經(jīng)濟(jì)建模與預(yù)測必須將其置于經(jīng)濟(jì)大背景下,,把研究對(duì)象作為經(jīng)濟(jì)問題,,而非單純的統(tǒng)計(jì)學(xué)問題來考察。應(yīng)用逐步回歸法建立經(jīng)濟(jì)模型時(shí),,應(yīng)該基本遵循以下步驟,,并設(shè)定理論模型為多元線性回歸模型:第一,選取合適的變量,;第二,,樣本數(shù)據(jù)的收集與整理;第三,,模型參數(shù)估計(jì),;第四,應(yīng)用逐步回歸法并結(jié)合其他的模型檢驗(yàn),,確定最優(yōu)的線性回歸方程,;第五,根據(jù)上述模型,,分析實(shí)際問題,,得出結(jié)論或是提出政策建議等。 逐步回歸的基本思想是逐個(gè)引入新變量,,每引入一個(gè)新變量時(shí)考慮是否剔除已選變量,,直至不再引入新變量。這種方法既保障了方程能保留影響顯著的變量,,又能夠剔除非顯著的變量,。它以向前回歸為主,結(jié)合向后剔除法,,通??梢垣@得較好地?cái)M合效果,因此,,被廣泛應(yīng)用于經(jīng)濟(jì)建模與預(yù)測,。不過,這并不代表逐步回歸法就是毫無缺陷的方法,。理論上,,在變量個(gè)數(shù)較少時(shí),全子集法是能夠獲得在某一準(zhǔn)則下的最優(yōu)回歸方程,,而且計(jì)算量也在可以接受的范圍,,相對(duì)于逐步回歸法可能更優(yōu)。而逐步回歸法則依賴于人為確定的顯著性水平,,不同的顯著性水平可能得到的結(jié)果不一樣,,而且也很難給出理論上證明其回歸方程的最優(yōu)性。換言之,,逐步回歸法只是一種實(shí)踐上較為有效的方法,,理論上它沒有被證明所得到的回歸方程即為最優(yōu)的回歸方程。 考察運(yùn)用逐步回歸法建立最優(yōu)回歸模型的經(jīng)濟(jì)論文,,能夠發(fā)現(xiàn)一些問題,。歸納總結(jié)這些問題,才能更好地運(yùn)用這一方法解決經(jīng)濟(jì)問題,。 (1)在經(jīng)濟(jì)建模與預(yù)測的應(yīng)用中,,對(duì)逐步回歸的具體操作有很大不同。有些學(xué)者使用向前引入法,,逐個(gè)將變量引入方程,;而有些學(xué)者使用的本質(zhì)上是向后剔除法,逐個(gè)剔除變量;還有部分學(xué)者,,做了多次逐步回歸,,然后以一些標(biāo)準(zhǔn)綜合比較結(jié)果以選擇最優(yōu)的。這些情況都充分說明了經(jīng)濟(jì)研究中本質(zhì)上采納的是逐步回歸法的基本思想,,而不一定與多元統(tǒng)計(jì)分析理論當(dāng)中的逐步回歸分析完全一致,,也體現(xiàn)了逐步回歸分析在經(jīng)濟(jì)建模運(yùn)用中的靈活性。但是,,對(duì)于同一經(jīng)濟(jì)問題建立模型,,向前引入法與向后剔除法、嚴(yán)格的逐步回歸法得到的結(jié)果是否一致,,結(jié)果是否最優(yōu)都是值得思考的問題,。 (2)在經(jīng)濟(jì)建模中,逐步回歸法選取或剔除變量往往同時(shí)結(jié)合各種檢驗(yàn),,包括經(jīng)濟(jì)意義檢驗(yàn),、統(tǒng)計(jì)學(xué)檢驗(yàn)、計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn),、模型預(yù)測檢驗(yàn)等,。逐步回歸法雖然一定程度上避免了多重共線性,但是其他問題(如隨機(jī)干擾項(xiàng)的異方差性,、序列相關(guān)性,、隨機(jī)解釋變量問題)卻無法全部得到解決,因此逐步回歸法需要經(jīng)過經(jīng)濟(jì)意義檢驗(yàn),、統(tǒng)計(jì)學(xué)檢驗(yàn),、計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)等多重檢驗(yàn)。經(jīng)濟(jì)模型一個(gè)重要的應(yīng)用在于經(jīng)濟(jì)預(yù)測,,模型的預(yù)測精確度是考察模型優(yōu)劣性的一個(gè)重要指標(biāo),,所以逐步回歸法需要通過模型預(yù)測檢驗(yàn)。 (3)在經(jīng)濟(jì)建模的整個(gè)過程中,,一定要考慮解釋變量間,、解釋變量與被解釋變量間的經(jīng)濟(jì)關(guān)系,或者考察經(jīng)濟(jì)環(huán)境,,不能忽視經(jīng)濟(jì)理論與經(jīng)濟(jì)行為規(guī)律,,畢竟研究目的不僅是單純地處理分析樣本數(shù)據(jù),而是想要通過揭示變量的客觀的數(shù)據(jù)關(guān)系,,從而進(jìn)一步揭示變量之間的規(guī)律,。 |
|