線性模型(Linear Model),,是機器學(xué)習(xí)中的一類算法的總稱,其形式化定義為:通過給定的樣本數(shù)據(jù)集,,線性模型試圖學(xué)習(xí)到這樣的一個模型,,使得對于任意的輸入特征向量,模型的預(yù)測輸出能夠表示為輸入特征向量的線性函數(shù),,即滿足:
也可以寫成矩陣的形式: 其中,,和稱為模型的參數(shù)。 為了求解線性模型的參數(shù)和,,首先我們定義損失函數(shù),,在回歸任務(wù)中,常用的損失函數(shù)是均方誤差: 優(yōu)化損失函數(shù)就是我們的目標(biāo),,基于均方誤差損失函數(shù)來求解模型參數(shù)的方差,,也就是我們熟悉的最小二乘法,最小二乘法的思想其實就是尋找一個超平面,,使得訓(xùn)練數(shù)據(jù)集中的所有樣本點到這個超平面的歐式距離最小,。 OK,接下來就是優(yōu)化問題了,,如何取優(yōu)化該損失函數(shù),,從而獲得最優(yōu)模型參數(shù)和,因為該損失函數(shù)是凸函數(shù),根據(jù)極值存在的必要條件,,我們可以運用解析法進行求解,。 下面我們將給出詳細(xì)的推導(dǎo)求解和的過程: 1. 首先將參數(shù)和進行合并,用來進行表示:, 容易知道是維度,。 對輸入特征向量進行改寫,,,則全體訓(xùn)練集,,可用矩陣進行如下表示: 對輸入特征向量的輸出標(biāo)簽,,可以改寫為:
2. 根據(jù)1.我們可以知道是一個的矩陣,,這樣模型在訓(xùn)練集上所有預(yù)測結(jié)果可以寫成矩陣形式:
3. 根據(jù)1和2,損失函數(shù)可以轉(zhuǎn)化為矩陣形式: 根據(jù)極值存在的必要條件,,下面進行對參數(shù)的求導(dǎo): 對上一步結(jié)果進行展開 轉(zhuǎn)換為跡運算 對上一步結(jié)果進行展開 根據(jù)常見矩陣求導(dǎo)公式,可知 根據(jù)常見矩陣求導(dǎo)公式,,可知 根據(jù)常見矩陣求導(dǎo)公式,可知 綜上可知,, 令,,可得,求解得到 需要注意,,要保證對稱矩陣是可逆的,,如果不可逆,則解析法求解失效,。 完,,脊回歸的推導(dǎo)也很相似。 |
|