幀間預(yù)測(cè)編碼原理（轉(zhuǎn)） - wpf的日志 - 網(wǎng)易博客

dongmeng 2011-05-17

展開(kāi)全文

幀間預(yù)測(cè)編碼原理（轉(zhuǎn)）

h.264和AVS的學(xué)習(xí) 2009-07-28 14:52:37 閱讀874 評(píng)論0 字號(hào)：大中小訂閱

幀間預(yù)測(cè)編碼是利用視頻圖像幀間的相關(guān)性，即時(shí)間相關(guān)性,，來(lái)達(dá)到圖像壓縮的目的,，廣泛用于普通電視、會(huì)議電視,、視頻電話,、高清晰度電視的壓縮編碼。

在圖像傳輸技術(shù)中,，活動(dòng)圖像特別是電視圖像是關(guān)注的主要對(duì)象,。活動(dòng)圖像是由時(shí)間上以幀周期為間隔的連續(xù)圖像幀組成的時(shí)間圖像序列，它在時(shí)間上比在空間上具有更大的相關(guān)性,。大多數(shù)電視圖像相鄰幀間細(xì)節(jié)變化是很小的,，即視頻圖像幀間具有很強(qiáng)的相關(guān)性，利用幀所具有的相關(guān)性的特點(diǎn)進(jìn)行幀間編碼,，可獲得比幀內(nèi)編碼高得多的壓縮比,。對(duì)于靜止圖像或活動(dòng)很慢的圖像，可以少傳一些幀,，如隔幀傳輸,，未傳輸?shù)膸媒邮斩说膸鎯?chǔ)器中前一幀的數(shù)據(jù)作為該幀數(shù)據(jù),，對(duì)視覺(jué)沒(méi)有什么影響,。因?yàn)槿搜蹖?duì)圖像中靜止或活動(dòng)慢的部分，要求有較高的空間分辨率,，而對(duì)時(shí)間分辨率的要求可低些,。這種方法叫幀重復(fù)方法，廣泛應(yīng)用于視頻電話,、視頻會(huì)議系統(tǒng)中,，其圖像幀速率一般為1~15幀/秒。

采用預(yù)測(cè)編碼的方法消除序列圖像在時(shí)間上的相關(guān)性,，即不直接傳送當(dāng)前幀的像素值,，而是傳送x和其前一幀或后一幀的對(duì)應(yīng)像素x'' 之間的差值,這稱為幀間預(yù)測(cè)。當(dāng)圖像中存在著運(yùn)動(dòng)物體時(shí),，簡(jiǎn)單的預(yù)測(cè)不能收到好的效果,，例如在圖04-01-6中當(dāng)前幀與前一幀的背景完全一樣，只是小球平移了一個(gè)位置,，如果簡(jiǎn)單地以第k-1幀像素值作為k幀的預(yù)測(cè)值,，則在實(shí)線和虛線所示的圓內(nèi)的預(yù)測(cè)誤差都不為零。如果已經(jīng)知道了小球運(yùn)動(dòng)的方向和速度,，可以從小球在k-1幀的位置推算出它在k幀中的位置來(lái),，而背景圖像（不考慮被遮擋的部分）仍以前一幀的背景代替，將這種考慮了小球位移的k-1幀圖像作為k幀的預(yù)測(cè)值,，就比簡(jiǎn)單的預(yù)測(cè)準(zhǔn)確得多,，從而可以達(dá)到更高的數(shù)據(jù)壓縮比。這種預(yù)測(cè)方法稱為具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè),。

幀間預(yù)測(cè)編碼原理（轉(zhuǎn)） - wpf - 小小e家人

圖 04-01-6 幀間預(yù)測(cè)與具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)

具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)編碼是視頻壓縮的關(guān)鍵技術(shù)之一,，它包括以下幾個(gè)步驟：首先，將圖像分解成相對(duì)靜止的背景和若干運(yùn)動(dòng)的物體,，各個(gè)物體可能有不同的位移,，但構(gòu)成每個(gè)物體的所有像素的位移相同,，通過(guò)運(yùn)動(dòng)估值得到每個(gè)物體的位移矢量；然后,，利用位移矢量計(jì)算經(jīng)運(yùn)動(dòng)補(bǔ)償后的預(yù)測(cè)值,；最后對(duì)預(yù)測(cè)誤差進(jìn)行量化、編碼,、傳輸，同時(shí)將位移矢量和圖像分解方式等信息送到接收端,。圖04-01-7示出了具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)器的原理框圖,。

幀間預(yù)測(cè)編碼原理（轉(zhuǎn)） - wpf - 小小e家人

圖04-01-7 具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)器功能框圖

在具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)編碼系統(tǒng)中，對(duì)圖像靜止區(qū)和不同運(yùn)動(dòng)區(qū)的實(shí)時(shí)完善分解和運(yùn)動(dòng)矢量計(jì)算是較為復(fù)雜和困難的,。在實(shí)際實(shí)現(xiàn)時(shí)經(jīng)常采用的是像素遞歸法和塊匹配法兩種簡(jiǎn)化的辦法,。

像素遞歸法的具體作法是，仍需通過(guò)某種較為簡(jiǎn)單的方法首先將圖像分割成運(yùn)動(dòng)區(qū)和靜止區(qū),。在靜止區(qū)內(nèi)像素的位移為零,，不進(jìn)行遞歸運(yùn)算；對(duì)運(yùn)動(dòng)區(qū)內(nèi)的像素,，利用該像素左邊或正上方像素的位移矢量D作為本像素的位移矢量,，然后用前一幀對(duì)應(yīng)位置上經(jīng)位移D后的像素值作為當(dāng)前幀中該像素的預(yù)測(cè)值。如果預(yù)測(cè)誤差小于某一閾值,，則認(rèn)為該像素可預(yù)測(cè),，無(wú)需傳送信息；如果預(yù)測(cè)誤差大于該閾值,，編碼器則需傳送量化后的預(yù)測(cè)誤差,、以及該像素的地址，收,、發(fā)雙方各自根據(jù)量化后的預(yù)測(cè)誤差更新位移矢量,。由此可見(jiàn)，像素遞歸法是對(duì)每一個(gè)像素根據(jù)預(yù)測(cè)誤差遞歸地給出一個(gè)估計(jì)的位移矢量,，因而不需要單獨(dú)傳送位移矢量給接收端,。

塊匹配法是另一種更為簡(jiǎn)單的運(yùn)動(dòng)估值方法。它將圖像劃分為許多子塊,，并認(rèn)為子塊內(nèi)所有像素的位移量是相同的,，這意味著將每個(gè)子塊視為一個(gè)“運(yùn)動(dòng)物體”。對(duì)于某一時(shí)間t,圖像幀中的某一子塊如果在另一時(shí)間t-t1的幀中可以找到若干與其十分相似的子塊,，則稱其中最為相似的子塊為匹配塊,，并認(rèn)為該匹配塊是時(shí)間t-t1的幀中相應(yīng)子塊位移的結(jié)果。位移矢量由兩幀中相應(yīng)子塊的坐標(biāo)決定,。

考慮到一定時(shí)間間隔內(nèi)物體可能的運(yùn)動(dòng)速度,、運(yùn)動(dòng)范圍和匹配搜索所需的計(jì)算量，在匹配搜索時(shí)一般僅在一個(gè)有限范圍內(nèi)進(jìn)行。假設(shè)在給定時(shí)間間隔內(nèi)最大可能的水平和垂直位移為d h和d v個(gè)像素,，則搜索范圍SR為

幀間預(yù)測(cè)編碼原理（轉(zhuǎn)） - wpf - 小小e家人

其中M,、N為子塊的水平和垂直像素?cái)?shù)。

在塊匹配方法中需要解決兩個(gè)問(wèn)題：一是確定判別兩個(gè)子塊匹配的準(zhǔn)則,；二是尋找計(jì)算量最少的匹配搜索算法,。判斷兩個(gè)子塊相似程度的準(zhǔn)則可以利用兩個(gè)塊間歸一化的二維互相關(guān)函數(shù)、兩子塊間亮度的均方差MSE或兩子塊間亮度差絕對(duì)值的均值MAD等,。通過(guò)對(duì)不同判別準(zhǔn)則的比較研究表明,，各種判別準(zhǔn)則對(duì)位移矢量的估值精度影響差別不是很大。由于MAD準(zhǔn)則的計(jì)算不含有乘法和除法運(yùn)算而成為最常使用的匹配判別準(zhǔn)則,。MAD準(zhǔn)則定義如下：

幀間預(yù)測(cè)編碼原理（轉(zhuǎn)） - wpf - 小小e家人

其中Xk和Xk-1分別表示圖像在第k幀和第k-1幀的像素值,。當(dāng)MAD最小時(shí)，表示兩個(gè)子塊匹配,。

對(duì)于匹配搜索算法,，最簡(jiǎn)單和直接的方法就是全搜索方式，即將第k-1幀中的子塊在整個(gè)搜索區(qū)內(nèi)逐個(gè)像素移動(dòng),，每移動(dòng)一次計(jì)算一次判決函數(shù),。總的移動(dòng)次數(shù)為 (2d h + 1)(2d v + 1),。當(dāng)d h = d v = 6時(shí),，總的計(jì)算次數(shù)為169。顯然,，全搜索的運(yùn)算量是相當(dāng)大的,。為了加快搜索過(guò)程，人們提出了許多不同的搜索方法,，其中應(yīng)用較廣的有二維對(duì)數(shù)法,、三步法、共軛方向法和正交搜索法,。這幾種方法都基于如下的假設(shè)：當(dāng)偏離最小誤差方向時(shí),，判決函數(shù)是單調(diào)上升的，搜索總沿著判決函數(shù)值減小的方向進(jìn)行,。上述幾種方案所需的搜索步驟和計(jì)算點(diǎn)數(shù)略有差異,，但基本思路是一致的。

通過(guò)上面介紹的兩種運(yùn)動(dòng)矢量估值方法可以看出,，像素遞歸法對(duì)每一個(gè)像素給出一個(gè)估計(jì)的位移矢量,，因而對(duì)較小面積物體的運(yùn)動(dòng)估值較為精確。但像素遞歸法在估值時(shí)需要進(jìn)行疊代運(yùn)算,，從而存在著收斂速度和穩(wěn)定性問(wèn)題,。塊匹配法對(duì)同一子塊內(nèi)位移量不同的像素只能給出同一個(gè)位移估值,，限制了對(duì)每一像素的估值精度。但對(duì)于面積較大的運(yùn)動(dòng)物體而言,，采用塊匹配法的預(yù)測(cè)要比采用像素遞歸法的預(yù)測(cè)效果好,。另外，從軟硬件實(shí)現(xiàn)角度看,，塊匹配算法相對(duì)簡(jiǎn)單,，在實(shí)際活動(dòng)圖像壓縮編碼系統(tǒng)中得到較為普遍的應(yīng)用。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自： dongmeng > 《我的圖書(shū)館》

舉報(bào)/認(rèn)領(lǐng)