之前一直給大家分享的是Python的知識文檔,今天呢就給大家分享神經(jīng)網(wǎng)絡(luò)與機器學(xué)習(xí)的技術(shù)文檔吧,!希望能夠得到大家的喜歡?。?/p>
第1~4章構(gòu)成了本文的第一部分,主要介紹監(jiān)督學(xué)習(xí)的一些經(jīng)典方法,。具體介紹如下:
●第1章描述Rosenblatt 感知器,,重點介紹感知器收斂定理,以及在高斯環(huán)境下感知器和貝葉斯分類器的關(guān)系,。
●第2章講述作為模型建立基礎(chǔ)的最小二乘法,,建立了在特定的高斯環(huán)境下這一-方法和貝葉斯推理之間的關(guān)系。這一章還討論了用于模式選擇的最小描述長度(MDL)算法。
第3章講述最小均方(LMS)算法及其收斂分析,。其理論框架的分析揭示出兩個原理:Kushner直接法和朗之萬(Langevin) 方程(在非平衡態(tài)熱力學(xué)中很著名),。
這三章通過對不同概念的介紹揭示了其共同特點:它們都是基于一一個計算單元。更為重要的是,,它們從各自的角度深入,、細致地討論了學(xué)習(xí)過程的深層知識一這一-特征將在后續(xù)章節(jié)中進一步探討。
第4章是關(guān)于多層感知器的,,是Rosenblatt感知器的廣義版本,。這一相對比較長的章節(jié)包含如下主題:
●反向傳播算法、其優(yōu)點和局限性,,以及將其作為一個最優(yōu)化方法來計算偏導(dǎo)數(shù),。
●學(xué)習(xí)率的最優(yōu)退火和自適應(yīng)控制。
●交叉驗證,。
●卷積網(wǎng)絡(luò),,來自于Hube!和Wiesel在視覺系統(tǒng)方面的開拓性研究。
將監(jiān)督學(xué)習(xí)視為最優(yōu)化問題,,集中討論共軛梯度法,、擬牛頓法以及Marquardt- Leven-berg算法。
●非線性濾波,。
最后,,對于小規(guī)模和大規(guī)模學(xué)習(xí)問題作了對比。
第二部分包括第5章和第6章,,討論了基于徑向基函數(shù)(RBF)網(wǎng)絡(luò)的核方法。
從某種意義.上來說,,第5章可以看做是對核方法的深入介紹,。具體來說,這-一章包括如下幾個方面,。
●介紹Cover定理來作為對RBF網(wǎng)絡(luò)的構(gòu)造結(jié)構(gòu)的理論證明,。
●描述相對簡單的用于監(jiān)督學(xué)習(xí)的兩階段混合過程,第一階段基于聚類思想(即K-均值算法)來計算隱藏層,,第二階段利用LMS或者最小二乘法來計算網(wǎng)絡(luò)的線性輸出層,。
●介紹核回歸及其與RBF網(wǎng)絡(luò)的關(guān)系。
第6章介紹支持向量機(SVM),, 通常這-方法被認為是一種監(jiān)督學(xué)習(xí)方法,。本質(zhì)上SVM是一個兩類分類器,本章中將包括如下幾個主題:
定義在一-對線性可分的兩類之間最大分離邊緣的條件,。
●當(dāng)兩個類是線性可分或者不可分時用來司找最優(yōu)超平面的二次最優(yōu)化,。
●將SVM視為核機器,包含關(guān)于核欺騙和Mercer定理的討論。
●SVM的設(shè)計原理,。
●E不敏感損失函數(shù)及其在回歸問題最優(yōu)化中的作用,。
●表示定理及希爾伯特空間構(gòu)想和再生核希爾伯特空間構(gòu)想(RKHS)的作用。
根據(jù)以上描述,,很明顯支持向量機的基本理論是建立在很強的數(shù)學(xué)背景之上的,,因而SVM可以作為監(jiān)督學(xué)習(xí)的一個具有強大計算能力的、一流的工具,。
第三部分只有一章-第7章,。這一章介紹作為機器學(xué)習(xí)核心的正則化理論。本章將詳細探討如下幾個主題:
建立在第6章討論過的RKHS基礎(chǔ)之上的Tikhonov經(jīng)典正則化理論,。這一理論隱含了一些深奧的數(shù)學(xué)概念: Tikhonov泛函的Frechet微分,、Riesz表示定理、EulerLagrange方程,、Green 函數(shù),,以及多變量高斯函數(shù)。
廣義RBF網(wǎng)絡(luò)及其計算精確性的修正,。
正則最小二乘估計,,根據(jù)表示定理的再討論。
正則化參數(shù)估計,,利用Wahba的廣義交叉驗證概念,。
半監(jiān)督學(xué)習(xí),利用有標(biāo)簽和無標(biāo)簽樣本,。
可微流形及其在流形正則化中的作用一設(shè)計半監(jiān)督學(xué)習(xí)機的基礎(chǔ),。
尋找用于半監(jiān)督學(xué)習(xí)的RBF網(wǎng)絡(luò)中高斯核函數(shù)的光諧圖理論。
處理半監(jiān)督核機器的廣義表示定理,。
用于計算RBF網(wǎng)絡(luò)線性輸出層的拉普拉斯正則最小二乘(LapRLS) 算法,。這里需要說明的是,當(dāng)內(nèi)在正則化參數(shù)(對應(yīng)于無標(biāo)簽數(shù)據(jù))衰減為0的時候,,算法相應(yīng)地衰減為通常的最小二乘法,。
這一高度理論化的章節(jié)具有非常實際的重要意義。首先,,它提供了關(guān)于監(jiān)督學(xué)習(xí)機的正則化基礎(chǔ),。其次,它打下了設(shè)計正則化半監(jiān)督學(xué)習(xí)機的基礎(chǔ),。
第8~11章構(gòu)成本書的第四部分,,討論非監(jiān)督學(xué)習(xí)。
從第8章開始介紹由神經(jīng)生物學(xué)研究直接激發(fā)的自組織的四個原則,。
1)自增強學(xué)習(xí)的Hebb假定.
2)單個神經(jīng)元或者一組神經(jīng)元的突觸連接為了有限的資源而進行的競爭.
3)在勝利神經(jīng)元及其鄰居間的合作,。
4)包含于輸人數(shù)據(jù)中的結(jié)構(gòu)信息(如冗余),。
這一章的主要主題包括三個方面:
原則1)、2)和4)應(yīng)用于單個神經(jīng)元,,最大特征濾波的Oja規(guī)則來源于這些原則;通過自組織獲得的結(jié)果是值得注意的,,它包含了自底向上和自頂向下學(xué)習(xí)。其次,,最大特征濾波思想被推廣到主分量分析(PCA) 中,,用來對輸入數(shù)據(jù)進行維數(shù)削減,其所得算法稱為廣義Hebb算法(GHA),。
本質(zhì)上PCA是線性方法,,因而其計算能力局限于二階統(tǒng)計量。為了處理高階統(tǒng)計量.核方法以類似于第6章支持向量機的相似方式應(yīng)用于PCA,,但是和SVM的根本上的不同在于,,核PCA是非監(jiān)督方式。
遺憾的是,,在處理自然圖像的時候,,核PCA從計算的角度變得很難操控。為了克服這一計算局限性,,把GHA和核PCA結(jié)合起來組成一個新的在線非監(jiān)督學(xué)習(xí)算法,。稱為核Hebb算法(KHA), 這一方法可以用于圖像去噪。
KHA的產(chǎn)生是一個將機器學(xué)習(xí)的想法和來源于神經(jīng)網(wǎng)絡(luò)的補充想法結(jié)合起來的杰出例子,,結(jié)合所產(chǎn)生的新算法克服了它們各自的實際局限性,。
第9章介紹自組織映射(SOM),對自組織映射的開發(fā)遵從第8章介紹的自組織原則。從計算角度來說,,自組織映射是一個簡單的算法,,而且具有內(nèi)在的構(gòu)造拓撲映射的強大能力,它包括如下一些有用的特性:
●從空間上離散逼近輸人空間,,負責(zé)數(shù)據(jù)生成,。
拓撲次序,在某種意義上神經(jīng)元的空間位置在拓撲圖上對應(yīng)于輸人空間中的特定特征,。
輸人輸出密度匹配。
●輸人數(shù)據(jù)特征選擇,。
SOM在實際中被廣泛應(yīng)用,,構(gòu)造上下文映射和分層次矢量量化被作為SOM運算能力的兩個有說服力的例子。事實上,,令人驚異的是,,盡管SOM展示了多個有趣的特性并且能夠解決很難的計算任務(wù),但它依然缺少一個能用來最優(yōu)化的目標(biāo)函數(shù),。為了填補這一缺口,,以提供改進拓撲映射的可能性,,自組織映射采用了核方法。這一改進是通過引人一個煽函數(shù)作為目標(biāo).函數(shù)并且最大化這個函數(shù)來實現(xiàn)的,。我們再次看到了將來自于神經(jīng)網(wǎng)絡(luò)的思想和補充的核理論思想結(jié)合所帶來的實際好處,。
第10章探討如何將來自于香農(nóng)(Shannon)信息論的原則作為工具來實現(xiàn)非監(jiān)督學(xué)習(xí)。這一個相對較長的章節(jié)從回顧香農(nóng)信息論開始,,重點討論了熵,、互信息、相對熵(KLD) 等概念,。這一回顧也包括系詞(copula) 的概念,,遺憾的是這一.概念幾十年來沒有被注意到。更重要的是,,系詞提供了對一對相關(guān)隨機變量之間統(tǒng)計相關(guān)性的測量,。在任何事件中,集中于將互信息作為目標(biāo)函數(shù),,這一章建立了如下原則:
最大互信息原則,,最大化神經(jīng)系統(tǒng)的輸人和輸出之間的互信息:最大互信息和冗余減少之間有著很緊密的關(guān)系。
Imax原則,,最大化由相關(guān)輸人驅(qū)動的神經(jīng)系統(tǒng)對的單--輸出之間的互信息,。
Imin原則,以--種和Imax原則相似的方式操作,,但這里是最小化輸出隨機變量對之間的互信息,。
獨立分量分析(ICA) 原則,提供一種很強的工具用于盲分離來自統(tǒng)計獨立源信號的隱藏集合,。當(dāng)滿足-定的操作條件時,,ICA原則將提供對源信號進行恢復(fù)的起源程序基礎(chǔ),用于恢復(fù)的信號來自于對源信號的線性混合變形的相應(yīng)的觀察集合,。這里將介紹兩個特別的ICA算法,。
1)自然梯度學(xué)習(xí)算法,除了拉伸和排列之外,,通過最小化參數(shù)概率密度函數(shù)和相應(yīng)的階乘分布之間的KLD來解決ICA間題,。
2)最大熵學(xué)習(xí)算法,最大化反混合輸出的非線性變換版本的嫡,,這-算法通常被認為是ICA的最大化信息算法,,也表現(xiàn)出拉伸和排列性質(zhì)。
第10章還描述了另一個稱為快速ICA (FastICA) 的重要的ICA算法,,這一算法正如其名字那樣,,計算速度快。這-算法基于負嫡的概念最大化對比曬數(shù),,對比函數(shù)提供了對于隨機變量的非高斯分布程度的測量,。作為ICA的延續(xù),,本章繼續(xù)描述了一種稱為相關(guān)ICA的新算法,其開發(fā)是根據(jù)最大化信息和Imax原則的融合并經(jīng)由連接函數(shù)的運用來完成的:相關(guān)ICA在采集調(diào)幅信號的混合物的包跡時非常有用,。
第10章介紹了另-一個來自于香農(nóng)信息論的稱為速率失真理論的概念,,這一理論被用來開發(fā)這一章的最后 一個概念:信息瓶頸。給定關(guān)于輸人向量和(有關(guān)的)輸出向量的連接分布,,這--方法通過如下方式被構(gòu)造為約束最優(yōu)化問題:在兩個信息量之間做- -個權(quán)衡,, 一個信息量是關(guān)于輸人的瓶頸向量中包含的信息,另-一個信息址是關(guān)于輸出的瓶頸向量中所包含的信息,。這-章將利用信息瓶頸法來尋找數(shù)據(jù)表達的最優(yōu)流形,。
第11章講述非監(jiān)督學(xué)習(xí)的最后途徑,利用源自統(tǒng)計力學(xué)的隨機方法來實現(xiàn),。統(tǒng)計力學(xué)的研究和信息論密切相關(guān),。這一章從回順Helmholtz 自由能和嫡概念(從統(tǒng)計力學(xué)意義上)開始,緊接著介紹馬爾可夫鏈,。然后介紹用于產(chǎn)生馬爾可夫鏈的Metropolis算法,,其轉(zhuǎn)移概率將收斂到唯一的、穩(wěn)定的分布,。接下來以兩個方面作為隨機方法討論的結(jié)束: 一是用于全局最優(yōu)化的模擬退火,,二是Gibbs抽樣,它可以作為Metropolis算法的特殊形式,。有了手頭這些統(tǒng)計力學(xué)的背景知識,,就可以講述Boltzmann機了,Boltzmann機從歷史上來說是文獻中討論的第一個多層學(xué)習(xí)機器,。遺憾的是,,Boltzmann 機的學(xué)習(xí)過程非常慢,特別是當(dāng)隱藏神經(jīng)元的數(shù)目很大的時候,,因而其實用性是最主要的缺陷,。人們提出了很多變種方法來克服Boltzmann機的缺點。其中到目前為止最成功的創(chuàng)新方法是深度信度網(wǎng)絡(luò),,它明智地把下面的兩個功能組合起來形成了一個高效的機器:
●生成模型,,無監(jiān)督地--層--層自底向上學(xué)習(xí)所得結(jié)果。
●推論,,自頂向下學(xué)習(xí)所得結(jié)果.
第11章講述確定性退火來克服模擬退火極端的計算需求問題;確定性退火的問題在于其可能陷人局部極小點,。
5.到目前為止,集中精力講述了構(gòu)造用于監(jiān)督學(xué)習(xí),、半監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的算法。
第12章,,作為本書下一個部分,,是關(guān)于強化學(xué)習(xí)的,。強化學(xué)習(xí)以一種在線方式發(fā)生,作為智能體(如機器人)與其周圍的環(huán)境相互作用的結(jié)果,。實際上,,動態(tài)規(guī)劃是強化學(xué)習(xí)的核心。相應(yīng)地,,第15章的前面部分用來介紹Bellman動態(tài)規(guī)劃方法,,然后用來證明兩個廣泛使用的強化學(xué)習(xí)方法:時序差分學(xué)習(xí)(TD)和Q-學(xué)習(xí),這兩種方法能通過作為動態(tài)規(guī)劃的特例推導(dǎo)得出,。TD學(xué)習(xí)和Q-學(xué)習(xí)都是相對比較簡單的在線強化學(xué)習(xí)算法,。無需轉(zhuǎn)移概率知識。
然而,,其實際應(yīng)用局限于狀態(tài)空間的維數(shù)處于中等程度的情況,。在大規(guī)模動態(tài)系統(tǒng)中,維數(shù)災(zāi)難變得非常嚴重,,使得不僅僅是動態(tài)規(guī)劃,,也包括其近似形式的TD學(xué)習(xí)和Q -學(xué)習(xí)變得難以計算。為了克服這一嚴重的局限性,,這一章描述了兩個過近動態(tài)規(guī)劃的非直接方法:線性方法,。稱為最小二乘策略評估(LSPV)算法。
非線性方法,,利用神經(jīng)網(wǎng)絡(luò)(如多層感知器)作為通用遏近器,。
6.本書最后一部分包括第13、14和15章,,討論非線性反饋系統(tǒng),,特別強調(diào)遞歸神經(jīng)網(wǎng)絡(luò):
1)第13章研究神經(jīng)動力學(xué),對穩(wěn)定性問題給予了特別的關(guān)注,。這一- 章介紹了L.yapunov直接法,,這個方法包含兩個定理,一個用來處理系統(tǒng)穩(wěn)定性,,另一個用來處理漸近穩(wěn)定性,。這一方法的核心是Lyapunov函數(shù),通常來說能量函數(shù)就能滿足這--函數(shù)的要求,。有了這樣的背景知識,,就可以引出兩種聯(lián)想記憶模型:
Hopfield模型,這一模型的操作說明-個復(fù)雜的系統(tǒng)是能夠產(chǎn)生簡單的突現(xiàn)行為的,。盒中腦狀態(tài)模型,,它是聚類的基礎(chǔ)。
第13章還討論了混沌過程的特性及其動態(tài)重構(gòu)的正則化過程,。
2)第14章是關(guān)于貝葉斯濾波器的,,貝葉斯站波器至少從概念意義上提供了遂次狀態(tài)估計算法的統(tǒng)- -基礎(chǔ),。 這一章的發(fā)現(xiàn)總結(jié)為以下幾點:
經(jīng)典的線性高斯環(huán)境下的卡爾曼濾波器可以通過利用最小均方差準(zhǔn)則來推導(dǎo);在這一一章最后的一個習(xí)題中,證明這樣推導(dǎo)的卡爾曼濾波器是貝葉斯濾波器的特例,。
●平方根濾波用來克服卡爾曼濾波在實際應(yīng)用中遇到的發(fā)散現(xiàn)象,。
擴展卡爾曼濾波(EKF) 用來解決動力系統(tǒng)中非線性屬于軟排序的情況:保持高斯假設(shè)。
●以一個新的稱為數(shù)值積分卡爾曼濾波器(CKF)的濾波器為例來證明貝葉斯濾波器的直接通近形式,。這里再次強調(diào)了保持高斯假設(shè),。
●以粒子濾波器為例來證明貝葉斯逃波器的非直接逼近形式,粒子濾波器的實現(xiàn)能夠調(diào)節(jié)非線性程度和非高斯程度.
卡爾曼濾波本質(zhì)上是預(yù)測改正機制,,第14章接著描述“類卡爾曼能波”在人類大腦的一定區(qū)域的可能作用,。
本書第15章研究動態(tài)驅(qū)動的遞歸神經(jīng)網(wǎng)絡(luò)。這-章的開始部分討論不同的遞歸網(wǎng)絡(luò)結(jié)構(gòu)(模型)及其計算能力,,緊接著介紹訓(xùn)練遞歸網(wǎng)絡(luò)的兩個算法:邇過時間的反向傳播和實時遞歸學(xué)習(xí),。
遺憾的是,這兩個方法都是基于梯度的,,容易遭過所謂的消失梯度(vanishing gradient)問題,。為減輕這一問題,本書較詳細地討論了利用非線性逐次狀態(tài)估計,,采用全新的方式來對遞歸網(wǎng)絡(luò)進行監(jiān)督訓(xùn)練,。這里,對于擴展卡爾曼濾波器(簡單,,但是導(dǎo)數(shù)依賴)以及數(shù)值積分卡爾曼濾波器(導(dǎo)數(shù)自由,,但是數(shù)學(xué)上更加復(fù)雜)作為監(jiān)督學(xué)習(xí)的逐次狀態(tài)估計器的優(yōu)缺點進行了討論。此外,,還討論了對遞歸網(wǎng)絡(luò)來說唯一的自適應(yīng)行為的出現(xiàn)以及利用自適應(yīng)技巧來增強遞歸網(wǎng)絡(luò)性能的潛在好處.