比較通俗地講解一下泰勒公式是什么,。 泰勒公式,也稱泰勒展開(kāi)式。是用一個(gè)函數(shù)在某點(diǎn)的信息,,描述其附近取值的公式,。如果函數(shù)足夠平滑,在已知函數(shù)在某一點(diǎn)的各階導(dǎo)數(shù)值的情況下,,泰勒公式可以利用這些導(dǎo)數(shù)值來(lái)做系數(shù),,構(gòu)建一個(gè)多項(xiàng)式近似函數(shù),求得在這一點(diǎn)的鄰域中的值 所以泰勒公式是做什么用的,? 簡(jiǎn)單來(lái)講就是用一個(gè)多項(xiàng)式函數(shù)去逼近一個(gè)給定的函數(shù)(即盡量使多項(xiàng)式函數(shù)圖像擬合給定的函數(shù)圖像),,注意,逼近的時(shí)候一定是從函數(shù)圖像上的某個(gè)點(diǎn)展開(kāi),。泰勒公式在機(jī)器學(xué)習(xí)中主要應(yīng)用于梯度迭代,。 ****************************************************************************************************************************** 1. 問(wèn)題的提出多項(xiàng)式 是最簡(jiǎn)單的一類初等函數(shù)。關(guān)于多項(xiàng)式,,由于它本身的運(yùn)算僅是有限項(xiàng)加減法和乘法,,所以在數(shù)值計(jì)算方面,多項(xiàng)式是人們樂(lè)于使用的工具,。因此我們經(jīng)常用多項(xiàng)式來(lái)近似表達(dá)函數(shù),。這也是為什么泰勒公式選擇多項(xiàng)式函數(shù)去近似表達(dá)給定的函數(shù)。 ***************************************************************************************************************************** 2. 近似計(jì)算舉例初等數(shù)學(xué)已經(jīng)了解到一些函數(shù)如:的一些重要性質(zhì),,但是初等數(shù)學(xué)不曾回答怎樣來(lái)計(jì)算它們,,以 f(x) = 的近似計(jì)算為例: ①. 一次(線性)逼近 利用微分近似計(jì)算公式 f(x) f() + ()(x - ) (該式由導(dǎo)數(shù)/微分的極限表達(dá)公式轉(zhuǎn)換得到),對(duì) = 0 附近的 f(x) 的線性逼近為: f(x) f(0) + (0) x , 所以 f(x) = 1,,所以 f(x) 在 = 0 附近的線性逼近函數(shù) (x) = 1,,如下圖: 線性逼近優(yōu)點(diǎn):形式簡(jiǎn)單,計(jì)算方便,;缺點(diǎn):離原點(diǎn)O越遠(yuǎn),,近似度越差。 ②. 二次逼近 二次多項(xiàng)式 逼近 f(x) = ,,我們期望: = = = 1 = ( 即期望在 x = 0 處逼近函數(shù)和給定函數(shù)的函數(shù)值相等 ),; = = = 0 = ( 即期望在 x = 0 處逼近函數(shù)和給定函數(shù)的斜率相等 ); = = = -1,,所以 = ( 即期望在 x = 0 處逼近函數(shù)和給定函數(shù)的曲率相等 ),; 所以 = 1 - ,如下圖: 二次逼近要比線性逼近好得多,,但局限于 [ ,,] 內(nèi),該范圍外,,圖像明顯差異很大,。為什么我們期望兩個(gè)函數(shù)在某一點(diǎn)的函數(shù)值 ,、一階導(dǎo)數(shù)值、二階導(dǎo)數(shù)值相等,?因?yàn)檫@些值表達(dá)了函數(shù)(圖像)最基本和最主要的性質(zhì),,這些性質(zhì)逼近即可以使得兩個(gè)函數(shù)逼近(由上面函數(shù)圖像可以直觀地看出來(lái)) ③. 八次逼近 八次多項(xiàng)式 逼近 f(x) = ,我們期望: ,,求出 ( 即期望在 x = 0 處逼近函數(shù)和給定函數(shù)的函數(shù)值相等 ),; ,求出 ( 即期望在 x = 0 處逼近函數(shù)和給定函數(shù)的斜率相等 ),; .... .... .... ,求出 ( 即期望在 x = 0 處逼近函數(shù)和給定函數(shù)的曲率相等 ),; 所以 ,,如下圖: (綠色圖像) 比 (藍(lán)色圖像) 更大范圍內(nèi)更接近余弦函數(shù) (紅色圖像) 由上述3次不同程度的函數(shù)逼近可以看出:對(duì)于精確度要求較高且需要估計(jì)誤差的時(shí)候,必須用高次多項(xiàng)式來(lái)近似表達(dá)函數(shù),,同時(shí)給出誤差公式 ,。 以上就是利用多項(xiàng)式函數(shù)去逼近給定函數(shù)的一個(gè)過(guò)程。 ***************************************************************************************************************************** 3. 泰勒公式的推導(dǎo)由此引出一個(gè)問(wèn)題:給定一個(gè)函數(shù) ,,要找一個(gè)在指定點(diǎn) 附近與 很近似的多項(xiàng)式函數(shù) ,,記為:
使得 并且使得兩者誤差 可估計(jì)。所以要找的多項(xiàng)式應(yīng)該滿足什么條件,,誤差是什么,? 從幾何上看,,,代表兩條曲線,,如下圖: 使它們?cè)?nbsp;附近很靠近,很明顯: 1. 首先要求兩曲線在 點(diǎn)相交,,即 2. 如果要靠得更近,,還要求兩曲線在 點(diǎn)相切,(由圖像可以直觀看出,,相交 [ 棕色和紅色圖像 ] 和 相切 [ 綠色和紅色圖像 ],,兩曲線在 附近的靠近情況明顯差異很大,相切更接近),,即 3. 如果還要靠得更近,,還要求曲線在 點(diǎn)彎曲方向相同,(如上圖,,彎曲方向相反 [ 綠色和紅色圖像 ],;彎曲方向相同[ 藍(lán)色和紅色圖像 ],明顯在離 很遠(yuǎn)的地方,,彎曲方向相同兩函數(shù)的差異更小一點(diǎn)),,即 ,,進(jìn)而可推想:若在 附近有 ,,,近似程度越來(lái)越好,。 綜上所述,所要找的多項(xiàng)式應(yīng)滿足下列條件: 解釋一下上面的轉(zhuǎn)換時(shí)如何做的,,以上面第三行的二階導(dǎo)數(shù)為例: 第一個(gè)箭頭的轉(zhuǎn)換:將 求二階導(dǎo)函數(shù)后將 帶入,,求得 第二個(gè)箭頭的轉(zhuǎn)換:所以 ,所以 多項(xiàng)式函數(shù) 中的系數(shù) 可以全部由 表示,,則得到: 其中誤差為 ,。 因?yàn)槭怯枚囗?xiàng)式函數(shù)去無(wú)限逼近給定的函數(shù),所以兩者之間肯定存在一丟丟的誤差,。 **************************************************************************************************************************** 4. 泰勒公式的定義所以我們就得到了泰勒公式的定義: 如果函數(shù) 在含 的某個(gè)開(kāi)區(qū)間 內(nèi)具有直到 階導(dǎo)數(shù),,則對(duì) ,有 其中余項(xiàng) (即誤差) ,, 在 與 x 之間,。 泰勒公式的余項(xiàng)表達(dá)方式有好幾種,前面這種表是方法稱為n階泰勒展開(kāi)式的拉格朗日余項(xiàng),。拉格朗日余項(xiàng)即是n階泰勒公式又多展開(kāi)了一階,,n變?yōu)閚+1。注意,,這里的余項(xiàng)即為誤差,,因?yàn)槭褂枚囗?xiàng)式函數(shù)在某點(diǎn)展開(kāi),逼近給定函數(shù),,最后肯定會(huì)有一丟丟的誤差,,我們稱之為余項(xiàng)。 **************************************************************************************************************************** 5. 擴(kuò)展 —— 麥克勞林公式是泰勒公式的一種特殊情況:即當(dāng) 時(shí)的泰勒公式,。所以將 帶入公式,,即得: 幾個(gè)常見(jiàn)的初等函數(shù)的帶有佩亞諾余項(xiàng)的麥克勞林公式: 佩亞諾余項(xiàng)為 的高階無(wú)窮小 : |
|