假設(shè)有三個不同的骰子:一個常見的6面骰子(骰6),,還加上一個4面骰子(骰4)和一個8面骰子(骰8),如果均為公平骰子,,三種骰子得到每一個面的概率分別為1/6,、1/4、和1/8,,如圖7-3-1所示,。 現(xiàn)在,我們開始擲這3個骰子,,每次從三個骰子(骰6,、骰4、骰8)里隨機(jī)地挑一個,,等概率的情況下,,挑到每一個骰子的概率都是1/3。然后反復(fù)地重復(fù) “挑骰子,、拋骰子,、挑骰子、拋骰子……”,,便會產(chǎn)生一系列的狀態(tài)(骰子面上的數(shù)字),。例如,我們有可能得到如下一個數(shù)字序列A: 3 5 8 4 7 1 6 5 2 2 1…… (7-3-1) 圖7-3-1:擲三種骰子 個骰子得到的,,比如說,三個骰子都有可能得到數(shù)字3,,不過,,數(shù)字7、8只有骰8才能拋出來……等等,。 根據(jù)以上的說法,,序列(7-3-1)只是一個從外界觀察到的“骰子面”數(shù)字序列,并不等同于3個骰子實(shí)際拋丟的序列B: 骰4 骰6 骰8 骰6 骰8 骰6 骰6 骰8 骰4 骰8 骰6 (7-3-2) 圖7-3-2:隱馬爾可夫模型1 但兩者發(fā)生的概率之間有某種關(guān)聯(lián),。一般來說,將序列(7-3-1)叫做可觀察序列,,序列(7-3-2)叫做隱藏序列,,因?yàn)楸浑[藏的序列(7-3-2)是一個馬爾可夫鏈,,所以,這個擲骰子例子構(gòu)成了一個“隱馬爾可夫模型”,,如圖7-3-2所示。圖7-3-2中,,隱藏著的馬爾可夫鏈的狀態(tài)轉(zhuǎn)換概率矩陣用A表示,,在3個骰子等概率選擇的情形下,矩陣A中的所有概率都是1/3,。但事實(shí)上這個概率矩陣可以根據(jù)問題之需要而任意設(shè)定,。 使用更為數(shù)學(xué)化的語言:隱馬爾可夫模型λ是由初始狀態(tài)概率向量π、狀態(tài)轉(zhuǎn)移概率矩陣A和觀測概率矩陣B三個基本要素決定的,,可以用三元符號表示為: λ =(π, A, B),。 不少實(shí)際問題可以被抽象成隱馬爾可夫模型,還有一個最常見的簡單例子是維基百科中所舉的從朋友的活動情況來猜測當(dāng)?shù)氐臍庀竽P?,如圖7-3-3所示,。 從三個基本要素,可以歸納出隱馬爾可夫模型的三個基本問題:給定HMM求一個觀察序列的概率,,稱之為“評估”,;搜索最有可能生成一個觀察序列的隱藏狀態(tài)序列,稱之為“解碼”,;從給定的觀察序列生成一個HMM,,稱之為“學(xué)習(xí)”。對這些不同問題的解答,,有多種分析和算法,,我們不在此贅述。 隱馬爾可夫模型是隨機(jī)過程,,即一系列隨機(jī)變量的延伸,,但人工智能需要解決的問題可能是多維的隨機(jī)變量。比如說,,如果語音可以看作是一維的時間序列的話,,圖像就是二維的,而視頻則涉及到三維的隨機(jī)變量,。更一般而言,,將隨機(jī)變量的概率和統(tǒng)計之理論,與圖論結(jié)合起來,,不僅僅限于時間相關(guān)的“過程”,,而是形成了各種多維的概率圖(或網(wǎng)絡(luò))的概念,諸如貝葉斯網(wǎng)絡(luò),、馬爾可夫隨機(jī)場等,。 圖7-3-3:隱馬爾可夫模型2 |
|
來自: 昵稱11935121 > 《未命名》