標 題: 數(shù)字音頻廣播
發(fā)信站: 飲水思源站 (Tue Mar 21 22:06:52 2000), 轉信 [轉自清華] 緒論 §1-1 數(shù)字音頻信號壓縮的必要性 從1996年日本廣播協(xié)會研制出第一臺數(shù)字磁帶錄音機起,,數(shù)字音頻技術在幾十年內(nèi)得到 了迅速的發(fā)展,。到了九十年代,數(shù)字音頻技術進入了一個更高的階段,,逐步取代模擬技 術而走向家庭,。與傳統(tǒng)的模擬技術相比,數(shù)字技術具有無法比擬的優(yōu)點,,例如傳輸質量 高,;易于采用糾錯編碼技術提高抗干擾能力,易于大規(guī)模集成等,,所以一經(jīng)出現(xiàn)便得到 了迅速發(fā)展,,從窄帶電話,會議電視,,普通電視廣播到高清晰度電視廣播都在由模擬方 向向數(shù)字方向發(fā)展。 但是模擬信號數(shù)字化后占用的帶寬很寬,,給傳輸和記錄帶來不便,。例如,CD,、DAT等高保 真數(shù)字音頻信號,,取樣率為44.1KHz、16bit線性量化,,兩通道立體聲時,,數(shù)字信號的傳 輸率為1.41Mb/s(數(shù)字信號傳輸率=取樣頻率×量化比特×通道數(shù)),在傳輸這個數(shù)字音 頻信號時,,需要占用1.41MHz的帶寬,,這相當于模擬信號20KHz帶寬(兩通道占用40KHz) 的35倍,。在限定的頻帶內(nèi)傳輸,只能減少傳輸路數(shù),;用硬磁盤或磁光盤等大容量媒體記 錄,,耗時長,且難于做到小型化,,導致記錄成本增高,。因此,必須對模擬信號數(shù)字化后 的數(shù)據(jù)進行壓縮,,從而避免帶寬的限制,,發(fā)展更高領域的數(shù)字音頻技術。 §1-2 寬帶音頻編碼的國際標準 鑒于數(shù)字化音頻技術的優(yōu)點,,各國,、各大公司競相開發(fā)數(shù)字音頻信號的壓縮編碼技術。 比較有代表性的有:根據(jù)尤里卡計劃之一的1986年數(shù)字影響地面廣播系統(tǒng)開發(fā)計劃 開發(fā)的MUSICAM,,向ISO/IEC/SC2/WG11提議的ASPEC,,ATAC 和 SB-ADPEM,向CCIR提議的 日本廣播協(xié)會的低頻預測型子帶編碼,,PHILIPS 公司和松下公司推出DCC中所使用的PAS C,,美國杜比實驗室開發(fā)研制的AC-3等。這些編碼技術普遍利用了人耳的掩蔽效應和臨界 頻帶等聽覺特性來進行子帶編碼或者變換編碼,。 目前,,音頻壓縮編碼已成為標準的是 MPEG-1(ISO/IEC11172-3)、MPEG-2(ISO/IEC13 818-3)和美國大聯(lián)盟的AC-3,。 §1-2-1 MPEG 聲頻標準簡介 一,、 MPEG-1聲頻標準 MPEG專家組在制定音頻壓縮標準時,征求了14種方案,,先保留了4種,,再進一步工作后確 定了2種:MUSICAM(Masking Pattern Adapted Universal Subband Integrated Codin g And Multiplexing)-掩蔽型通用子頻帶集成編碼與頻分復用、ASPEC(Adaptive Spe ctral Perceptual Entroy Coding)-自適應頻譜感知熵編碼,。以上兩種算法確定了三種 層次,。層次1為簡化的MUSICAM,層次2等同MUSICAM ,,層次3是ASPEC算法結合MUSICAM算 法,,并對層次1、層次2向下兼容的一類算法,。 層次1最適合于消費者應用,,例如在數(shù)字化小型盒帶或磁光盤盤片上的家庭記錄,也就是 說,用于那些不強調很低碼率的應用,。PASC(在Philips公司的數(shù)字式小型盒帶中使用的 壓縮系統(tǒng))于等級1兼容,。 層次2通過在比例系數(shù)消除冗余度和不相干性而帶來了進一步的壓縮。等級2(除了幀頭 外)與MUSICAM 方案完全相同,。在消費和專業(yè)音頻中有著無數(shù)的應用,。例如地面的數(shù)字 音頻廣播(DAB)、Video-CD等,。 層次3采用了均勻量化,、自適應分段、量化值的熵編碼等技術,,編碼效率高,,但編碼器和 解碼器都比較復雜。層次3 在電信中最有用,,特別是窄帶ISDN,、衛(wèi)星線路,以及強制要 求在低碼率有最好質量的所有情況,。 二,、MPEG-2聲頻標準 1994年,音頻壓縮編碼由雙聲道擴展到多聲道,,仍然保持三層次,,聲道數(shù)擴展到5.1(或 3/2/0.1),即左,、中,、右三個主聲道,加左環(huán)和右環(huán)兩個環(huán)繞聲道和一個重低音聲道0 .1,,此即是MPEG-2標準. MPEG-2基本的幀格式與MPEG-1碼流完全相同,。附加的通道,例如中,、左環(huán),、右環(huán)在MPEG -1的附屬數(shù)據(jù)區(qū)中傳送。利用這些附加通道,,能夠支持多語言解說聲音,。 MPEG-2的另一項擴展是增加了使用較低采樣頻率(即低于32kHz)的方式,這些方式可在 碼率預算很有限的情況下應用于解說和電視會議系統(tǒng),。 §1-2-2 杜比AC-3簡介 AC-3起源于為高清晰度電視(HDTV)提供高質量的聲音。美國聯(lián)邦通信委員會FCC的高級 電視咨詢委員會ACATS(Advisory Committee on Advanced Television Service)于19 87年開始美國HDTV制式的研究,。最初的HDTV系統(tǒng)方案是模擬圖象和數(shù)字聲音傳輸,,其中 聲音編碼采用Dolby AC-1數(shù)字編碼器。AC-1通過4-2-4多聲道矩陣方式把聲道數(shù)減半,然 后采用增量調制( 調制)技術進行數(shù)字編碼,。1989年,,隨著聲音編碼技術和數(shù)字信號處 理器DSP的進步,AC-1發(fā)展為基于變換技術的AC-2系統(tǒng),,壓縮率加倍,,但多聲道矩陣處理 技術仍然保留著。為最大限度地發(fā)揮矩陣方式的特點,,必須把編碼的信號再編碼,,而且 要邊監(jiān)聽邊加以確認;對于電視現(xiàn)場節(jié)目而言,,有時一次解碼不能確認其效果,,這就限 制了矩陣方式在HDTV中的應用。由此,,人們提出用兩聲道的碼率提供多聲道編碼性能,, 而又沒有4-2-4矩陣方式的局限。AC-3就是為滿足此要求而研究的,。 AC-3使用5.1聲道,,碼率為320kb/s。 AC-3系統(tǒng)首先在電影業(yè)得到實現(xiàn),。1992年,,Dolby 正式推出了AC-3系統(tǒng)的商業(yè)產(chǎn)品,并 用于電影 Battman Return 中,。 世界電信聯(lián)盟ITU-R 在1991年接受基本5聲道格式的概念,,1992年修改了相應的建議草案 而接受0.1低頻效果聲道。1993年10月,,美國HDTV大聯(lián)盟建議采用AC-3,;1993年11月,高 級電視咨詢委員會ACATS正式批準HDTV系統(tǒng)采用AC-3聲音方案,。 AC-3是在AC-2基礎上發(fā)展起來的,,它繼承了AC-2的許多優(yōu)點,如窗處理,、變換編碼,、自 適應比特分配等。 §1-2-4 MUSICAM和AC-3的比較 AC-3是美國HDTV的聲音制式,,MUSICAM是歐洲尤里卡147計劃中的一個聯(lián)合研究組共同開 發(fā)的,作為ISO/IEC MPEG的聲音標準,。出于政治和經(jīng)濟的需要,MUSICAM 和AC-3在HDTV 和數(shù)字聲音廣播(DAB)方面的競爭是非常激烈的,。下面僅從技術角度和實際測試結果兩 個方面對兩個系統(tǒng)作一扼要比較,。 、濾波器組的實現(xiàn) MUSICAM 和AC-3 均需通過濾波器組把時域信號變?yōu)轭l域信號AC-3根據(jù)輸入信號的特性動 態(tài)地改變?yōu)V波器組的長度,以達到最佳的時間和頻率分辨率,。而MUSICAM采用了固定長度 的濾波器組,,實現(xiàn)比較容易,但有時與輸入信號特性不能最佳匹配,。 ,、自適應比特分配 MUSICAM 采用前向自適應比特分配方案,而AC-3采用混合前向/后向自適應比特分配方案 ,。前向自適應比特分配的特點是只在編碼器中使用聽覺模型,,因此可以隨時修改模型而 對解碼器沒有影響,但也有實際使用上的限制,,它要占用一部分有效的比特率傳送明確 的比特分配信息給解碼器,。后向自適應方案沒有從編碼器得到明確的比特分配信息;這 種方法的優(yōu)點是沒有占用有效的碼率來給解碼器傳送比特分配信息,,從而具有更高的傳 輸效率和更好的時間及頻率分辨率,。其缺點是解碼器從接收到的數(shù)據(jù)中計算比特分配, 因此,,計算不能太復雜,;同時,一旦編碼器中比特分配的算法固定,,解碼器投入使用后 ,,聽覺模型就不能再更新了。 ,、硬件實現(xiàn) 由于MUSICAM 采用前向自適應比特分配,,編碼器把解碼器必不可少的比特分配信息全部 提供給了解碼器,因此,,解碼器實現(xiàn)起來非常簡單?,F(xiàn)在已有許多專用集成電路(ASIC )芯片商品化。 相對而言,,AC-3解碼較為復雜,,但現(xiàn)在在Zoran公司ZR38000芯片DSP中也已實現(xiàn)簡化。 §1-3 MUSICAM的廣泛應用 MUSICAM算法具有適應面廣,、壓縮效果好,、解碼復雜度低、抗傳輸錯碼,、實時編碼等特點 ,,應用十分廣泛。MUSICAM 將是數(shù)字音頻領域的核心技術,。 在1986年12月的歐洲部長會議上,,決定了尤里卡147計劃-數(shù)字聲頻廣播(DAB)計劃,。此 后許多國家開展了DAB的研究及開發(fā)工作。我國已于1996年12月在珠江三角洲地區(qū)建成了 國內(nèi)第一個DAB試播臺,,即將在北京、天津一線建立第二個試播臺,。DAB系統(tǒng)具有模擬調 頻廣播無法比擬的優(yōu)點,,據(jù)稱在20年內(nèi)將取代現(xiàn)行調頻模式。雖然有不同的信源編碼方 法,,但MUSICAM 方法在主觀質量,、數(shù)據(jù)率、處理過程中所需的時間延遲以及復雜性等方 面,,提供了最佳的折中,,是迄今為止最適合DAB使用的源編碼方法。 另外,,目前國內(nèi)外出現(xiàn)了開發(fā)Video-CD,、DVD系列產(chǎn)品的熱潮。Video-CD,、DVD的用途不 僅包括卡拉OK,,還包括電影及音樂軟件、教育軟件等電子出版物,,具有很大的市場前景 ,。Video-CD的核心是MPEG-1的壓縮和解壓縮技術,DVD的核心是MPEG-2壓縮解壓縮技術,; 而MPEG-1,、MPEG-2聲頻部分的核心均是MUSICAM算法。 此外,,Philips最近研制的數(shù)字小型盒帶(DCC)錄音機也采用了MUSICAM 技術,。 §1-4 MUSICAM解碼芯片開發(fā)現(xiàn)狀 MPEG的解壓縮算法已經(jīng)作成高集成度的芯片。美國C-Cube公司是最先供應Video-CD編碼 和解碼芯片的廠家,,實力雄厚的SONY,、JVC、SGS-THOMSON,、TI,、PHILIPS、SANYO,、MATS USHITA等公司也都相繼開發(fā)出和正在開發(fā)MPEG解碼芯片,。但從目前看,美國C-Cube公司 在該領域處于領先地位,,它所推出的CL480芯片將前期預處理,、圖象解碼,、聲音解壓縮濃 縮在一塊超大規(guī)模集成電路上。SONY,、JVC等大公司在它們尚未開發(fā)出這種芯片前,,均已 決定在其產(chǎn)品上采用CL480。 目前我國的ASIC設計還剛剛處于起步階段,,還沒有人設計出MPEG-1的解碼芯片,。 |
|