音頻編解碼器技術解剖
發布時間:2011-03-16
中心議題:
一些音頻編碼解碼器芯片主要由圍繞一些處理硬件的一個模數轉換器(ADC)和一個數模轉換器(DAC)組成,但它們隻是眾所周知的海底冰山露出來的一角。最近一段時間,大部分工程師認為音頻編解碼器就是在DSP平台上運行的壓縮和解壓縮算法。在整個音頻頻率範圍裏,“語音”編解碼器適合數字電話應用,而“音頻”編解碼器則適合娛樂音頻應用。
在這個意義上,音頻編解碼器是從Dolby公司的噪音抑製技術演變成Dolby和其它一些公司更綜合性的壓縮方法。它們的出現還與國際標準組織(ISO)的運動圖像專家小組(MPEG)有關,該工作小組負責為數字音頻和視頻的編碼表示製定相應的標準。
盡管語音編解碼器技術的發展一定程度上處於靜止狀態,但音頻編解碼器技術一直在向前演進(參見圖1)。例li如ru,朝chao更geng多duo的de環huan繞rao聲sheng通tong道dao發fa展zhan就jiu是shi一yi個ge趨qu勢shi。最zui大da的de一yi個ge技ji術shu趨qu勢shi是shi增zeng加jia了le用yong於yu模mo擬ni立li體ti聲sheng係xi統tong中zhong的de多duo通tong道dao音yin頻pin的de技ji術shu,以yi再zai造zao特te別bie實shi況kuang音yin樂le會hui會hui場chang的de“現場感”。於是產生了完成所有這些處理的挑戰,因為你不再能用依靠AV接收器或DVD播放器內的大功率電源供電的DSP引擎來實現,而必須用靠手機或PDA中的電池供電的DSP引擎來實現。所有上述因素就為兩個不同但卻融合的應用領域(個人音頻和家庭影院)帶來了一個有趣的故事。
個人音頻
德州儀器公司(TI)便攜音頻和信息娛樂業務部首席技術官RandyCole指出,在個人音頻領域最普遍的音頻編碼解碼器是MP3(參見圖2)。MP3一度局限於PC和he便bian攜xie多duo媒mei體ti播bo放fang器qi,但dan它ta目mu前qian在zai手shou機ji行xing業ye中zhong也ye比bi比bi皆jie是shi,其qi原yuan因yin就jiu是shi手shou機ji製zhi造zao商shang不bu斷duan地di追zhui逐zhu新xin功gong能neng,以yi誘you使shi最zui終zhong用yong戶hu每mei隔ge六liu個ge月yue就jiu進jin行xing一yi次ci產chan品pin換huan代dai。
MP3是ISO公布的一項標準。它是由MPEG製定的MPEG-1編碼解碼標準係列中的第三個。MPEG-1有三層,每一層都包括前麵的層。因而,第3層實現了第1和2層。出於這個原因,MPEG-1及第3層就是眾所周知的MP3,它提供了一個適於便攜應用的帶寬和數據速率,雖然較低卻足夠了。
在過去10年中,MP3一直是下載音樂的主導性音頻編碼解碼器。但是蘋果公司的iPod在一項名為先進音頻編碼器(AAC)的新MPEG開發項目中打破了這個慣例。MPEG在1990年代中期開始從事AAC標準的製定,將其作為下一代MPEG-2研究的一部分,並實現了AT&T、Dolby、Fraunhof和索尼公司開發的最好最新設計理念。起初,它打算同MP3後向兼容,但這個目標不可能達到。
因此,由於整個行業深深卷入MP3,沒有一家公司願意調撥資源為AAC這個新方案生產大量的音頻節目,所以它衰敗了。也就是說,直到蘋果公司為iPod選擇AAC的MPEG-4版本之前,該技術一直處於衰敗的狀態。(在MPEG-2之後成立的下一個MPEG工作小組是MPEG-4,越過了MPEG-3。蘋果公司所用的MPEG-4AAC是MPEG-2AAC的一個強化版本,其數據速率稍低而質量有改進。)
其它專有的編碼器存在於MP3和AAC範疇之外。它們在PC和(he)個(ge)人(ren)多(duo)媒(mei)體(ti)設(she)備(bei)領(ling)域(yu)有(you)一(yi)定(ding)的(de)穿(chuan)透(tou)性(xing),但(dan)它(ta)們(men)在(zai)手(shou)機(ji)行(xing)業(ye)就(jiu)不(bu)太(tai)重(zhong)要(yao),因(yin)為(wei)手(shou)機(ji)生(sheng)產(chan)商(shang)寧(ning)願(yuan)標(biao)準(zhun)的(de)編(bian)碼(ma)器(qi)及(ji)其(qi)固(gu)定(ding)的(de)版(ban)稅(shui)。一(yi)種(zhong)大(da)家(jia)熟(shu)悉(xi)的(de)專(zhuan)有(you)編(bian)碼(ma)器(qi)是(shi)WindowsMediaAudio(WMA)。它主要用於PC,並在其中與MP3和AAC進行競爭。然而,從數據速率看,它很靈活(從低到高有適當的質量差異)。目前,還有WMA的多頻道版本WMA-Pro,而且微軟公司在2005年6月還發布了一種損耗更低的WMA。
其它重要的專有編碼器就是DolbyDigital,也就是著名的AC3。這種編碼器用於DVD和(美國的)數字電視。直到最近,它的運行速率對互聯網和手機來說還是太高。不過,需要補救的是一個把數據速率降得更低的新版本。
根據TI公司高性能音頻業務部行銷經理MohsinImtiaz的觀點,在家庭影院領域主要的編碼解碼器是Dolby和DTS。Dolby公司發布的DolbyDigitalPlus瞄準了高清晰度DVD和廣播市場。但是在MP3、AAC、WMA等便攜標準之間有一定的交叉。針對下一代DVD,微軟公司正在力推WMA。
解析一個編解碼器
讓我們分解一個編解碼器。為了把整個事情說清楚,我們看一篇在2004年10月音頻工程學會年會上提交的論文,它描述的是DolbyDigitalPlus技術。[page]
該論文說新的DolbyDigitalPlus編碼解碼器是基於DolbyDigital的較早版本,也叫AC-3。DolbyDigitalPlus或加強型的AC-3(E-AC-3)保留了元數據載運器、過濾器庫和幀結構。目前的數據速率範圍從32Kb/s到6.144Mb/s。在采樣速率32KHz和六模塊轉換幀的條件下,數據速率控製的分辨率可達到每秒1/3位。(數據速率的分辨率正比於采樣速率,反比於幀的尺寸。)
E-AC-3保留了AC-3的六個256係數轉換幀結構,但它允許包含一個、兩個和三個256係數轉換模塊的較短幀存在。其結果就是,音頻傳輸可以在高於6?0Kb/s的速率下進行,這適合於某些限製了每幀數據量的DVD。
E-AC-3可以支持目前的5.1、6.1或7.1頻道,進而一直到電影院的13.1頻道。主音頻節目位流加上多達八個的附加子流經過多路選通進入一個單一的E-AC-3位流。通過頻道替換消除了矩陣減法引起的編碼失誤。與AC-3相比,E-AC-3能多傳輸七個獨立的位流。
編碼效率的提高還可以通過一個新的濾波器庫、更好的量化、強化的頻道耦合、譜擴展和一種名為“瞬態預噪音處理”的技術來實現。
當具有穩定特征的音頻出現時,該濾波器庫在現有的AC-3濾波器庫之後加入一個二級DCT。這把六個256係數轉換模塊轉換成一個單一的1536係數混合轉換模塊,且提高了頻率分辨率。這個提高的頻率分辨率與六維向量分量(VQ)及增益自適應分量(GAQ)結合在一起可以改進“難於編碼”信號的編碼效率,比如說黑管和大鍵琴。
VQ用於需要較低準確度的頻帶區。當需要更高準確度分量時,GAQ更有效率。此外,通過頻道與相位保存的耦合可以使編碼效率得到一個提升。在AC-3用(yong)一(yi)個(ge)高(gao)頻(pin)單(dan)合(he)成(cheng)頻(pin)道(dao)作(zuo)為(wei)每(mei)個(ge)頻(pin)道(dao)上(shang)高(gao)頻(pin)部(bu)分(fen)的(de)地(di)方(fang),加(jia)入(ru)相(xiang)位(wei)信(xin)息(xi)和(he)編(bian)碼(ma)器(qi)控(kong)製(zhi)的(de)譜(pu)幅(fu)度(du)處(chu)理(li)能(neng)夠(gou)讓(rang)這(zhe)個(ge)高(gao)頻(pin)單(dan)合(he)成(cheng)頻(pin)道(dao)處(chu)理(li)較(jiao)低(di)的(de)頻(pin)率(lv),從(cong)而(er)減(jian)小(xiao)了(le)有(you)效(xiao)的(de)編(bian)碼(ma)帶(dai)寬(kuan)並(bing)增(zeng)大(da)了(le)編(bian)碼(ma)效(xiao)率(lv)。
譜擴展是用頻域上轉換的較低頻譜段代替了較高層的頻率轉換係數。該轉換頻譜段的譜特征通過轉換係數的譜調製與原始的形式匹配。
為了提高低數據速率時的音頻質量,E-AC-3caiyongleshuntaiyuzaoyinchulijishu。zhegehoujiemaguochengbayuzaoyinwuchajiangdaozuidi,qizuofashicaiyongkesuoduanyuzaoyinchixushijiandeshibiaohechengjishu,yinerjiangdileshuntairaodongdeketingdu。youbianmaqijisuanbingzaiE-AC-3位流中發送的元數據提供了後解碼過程、時標合成處理所需的參數,時標合成處理使用了聽覺情景分析技術。
後處理
用於音頻編碼解碼器中後處理的專有算法與DolbyDigitalPluszheleiyasuobiaozhunyiyangzhongyao,tamenduirenheshouxukerenyexiangtong。zaizhegelingyuzhong,zhexiesuanfaduiduopindaobiaozhunxiedaidexinxijinxingcaozuo,congerbajiatingyingyuanzhuanhuachengrenhexingshideshoutingchangsuo:從一個巨大的教堂到一個爵士音樂俱樂部的戶外搖滾音樂會。
按照ADI公司SigmaDSP產品經理ThomasIrrgang的說法,後處理全都是圍繞著OEM商追求一個“簽名聲音”的願望開展的。大概最先做成功這點的是THX公司。其它開展後處理研究的公司包括SRS、TruSurroundXT和TruBass。
在電視領域有能夠複原MP-3編碼損失的後處理器BBE,包括BBE3D和BBEMP。還有一種專門用於電視的算法BBEViva,在電視中立體聲話筒一般放置的非常近以便獲得良好的立體聲收聽效果。
低音增強在便攜係統和電視機中正變得重要起來,這些設備不會給大的話筒驅動器留有大的空間。目前最突出的是WAVES公司的MaxxBass算法,它大概也是最流行的低音增強算法,因為它增強了正被處理材料中低音的主觀感受水平,同時又不加入任何低頻能量。
Dolby公司在後處理領域以其VirtualSpeaker(虛擬話筒)和DolbyHeadphone(Dolby耳麥)算法而聞名於世。Dolby公(gong)司(si)表(biao)示(shi)其(qi)技(ji)術(shu)複(fu)製(zhi)了(le)多(duo)個(ge)所(suo)以(yi)聲(sheng)音(yin)簽(qian)名(ming),包(bao)括(kuo)反(fan)射(she),同(tong)時(shi)提(ti)供(gong)了(le)串(chuan)擾(rao)抵(di)消(xiao),以(yi)便(bian)保(bao)持(chi)每(mei)個(ge)耳(er)朵(duo)的(de)環(huan)繞(rao)音(yin)質(zhi)不(bu)被(bei)其(qi)它(ta)話(hua)筒(tong)的(de)環(huan)繞(rao)音(yin)質(zhi)所(suo)抵(di)消(xiao)。虛(xu)擬(ni)話(hua)筒(tong)和(he)Dolby耳麥算法最初是由澳大利亞的LakeDSP公司開發的。Lake現在是Dolby的一家分公司。
當然,天下沒有免費的午餐。諸如虛擬話筒這樣的算法隻能在一個相對小的室內空間(俗稱“甜場”)中模仿缺失話筒的存在。在這個“甜場”之外,環繞信息崩潰了。該聲音不算壞,但聽起來它來自一個常規的雙耳話筒設置,情況就是這樣。
為了重新生成一個物理空間,Panasonic公司的網站上說,其HallMode(大廳模式)“再生了回響效果,使聽眾有一種空曠之音繞著自己傳播的感覺,”而且它在“享受音樂廳內的交響樂表演時的效果尤其好。”一個雅馬哈A/V接收器的評論家認為雅馬哈的音樂廳“的確加入了額外的一維,使人感到聲場的高度,‘音樂廳模式’甚至讓你忍不住要嚐試一下。對於令人喜愛的Mahler第四交響樂的立體聲錄音,‘音樂廳模式’給人一種親臨現場的感覺。”
房間修正
在後處理領域,超越虛擬化的下一步就是房間修正。這個功能開始出現於2002年或2003年的高端多頻道係統中,而且目前已經發展到處於價格/性能譜係中端的係統。它對一套公寓樓內家庭影院係統的用戶滿意度至關重要,因為在家庭影院係統中不可能對稱設置左、youhuatong,huozheshuofangjianneiyiduqiangdeshengxuexingnengbutongyutaduimianqiangdeshengxuexingneng。duopindaoxitongcongfangjianxiuzhengjishuzhonghuoyizuiduo。tayexuduiliangpindaoshezhideyingxiangjiaoxiao,danlitishengxitongyibanshuolaiduiwutiaozhenghewuxiaozhunbunamemingan。
房間修正涉及到把該係統調整為TEST(測試)模(mo)式(shi),在(zai)最(zui)喜(xi)歡(huan)的(de)傾(qing)聽(ting)位(wei)置(zhi)處(chu)放(fang)一(yi)個(ge)麥(mai)克(ke)風(feng),並(bing)播(bo)放(fang)出(chu)一(yi)係(xi)列(lie)測(ce)試(shi)聲(sheng)音(yin)以(yi)便(bian)弄(nong)清(qing)楚(chu)房(fang)間(jian)聲(sheng)學(xue)性(xing)能(neng)方(fang)麵(mian)的(de)信(xin)息(xi)和(he)話(hua)筒(tong)本(ben)身(shen)的(de)局(ju)限(xian)性(xing),隨(sui)後(hou)根(gen)據(ju)專(zhuan)有(you)算(suan)法(fa)調(tiao)整(zheng)增(zeng)益(yi)和(he)均(jun)衡(heng)度(du)。對(dui)於(yu)房(fang)間(jian)整(zheng)定(ding)技(ji)術(shu),一(yi)個(ge)令(ling)人(ren)感(gan)興(xing)趣(qu)的(de)交(jiao)叉(cha)領(ling)域(yu)是(shi)汽(qi)車(che)應(ying)用(yong)。多(duo)年(nian)來(lai),一(yi)直(zhi)在(zai)對(dui)昂(ang)貴(gui)汽(qi)車(che)內(nei)OEM的音響係統進行聲學調整以便獲得最佳性能,但這是一個相當費力而且相當主觀的人工過程。
qichezhizaoshangyijingkaishicaiyongzidongdetingjiaokongjiantiaozheng。shijianzhengming,chulefengfudetingjiaojingyanwai,zheleitiaozhengyigezuizhongyaodefangmianjiushishengxueshangdehuiyindixiao。zheyiweizhexiaochucongmianshounahuatongdaoanzhuangzaitaiyangmaohuotoudingchumaikefengdefankui。
手機和個人多媒體設備的融合
MP3和AAC數據速率對個人多媒體播放器及PC是(shi)恰(qia)當(dang)的(de)。但(dan)對(dui)於(yu)手(shou)機(ji)來(lai)說(shuo),數(shu)據(ju)速(su)率(lv)必(bi)須(xu)要(yao)低(di)一(yi)些(xie)。而(er)且(qie)顯(xian)而(er)易(yi)見(jian)的(de)是(shi),與(yu)下(xia)載(zai)音(yin)樂(le)文(wen)件(jian)以(yi)便(bian)稍(shao)後(hou)播(bo)放(fang)相(xiang)比(bi),通(tong)過(guo)蜂(feng)窩(wo)網(wang)鏈(lian)接(jie)的(de)流(liu)音(yin)頻(pin)有(you)著(zhe)很(hen)不(bu)同(tong)的(de)需(xu)求(qiu)。
由第3代合作規劃委員會(3GPP)製訂的3G手機標準采用AAC作為音頻編碼解碼器標準,可滿足了這兩類應用的要求。該標準最新的修改版(版本6)允許使用兩種音頻編碼解碼器中的任何一種。一種就是AAC的強化版,叫做AAC-Plus或高效率AAC(HE-AAC)。
前不久,強化AAC-Plus或高效率AAC的第二套改進版(版本2)也添加進來。另一種選擇是“AMRWidebandPlus”,它是一種強化的語音編碼器。對GSM手機來說,AMR寬帶是一種非常流行的語音編碼器。其Plus改進版將其應用擴展到可處理音樂。
蘇格蘭的Wolfson微電子公司從事硬件音頻編碼解碼器的製造,該公司新產品開發部的副總裁PeterFrith指出,給手機加入回放MP3degongneng,huozheyongyuxiazaiyinle,huozhezuoweigaozhiliangdelingsheng,yiweizheyonghuyijingxiwangzaishoujizhongkandaoyigexiangduigaobaozhendehuifangxitong。yinci,shoujizhizaoshangmuqianqipanchuxiangonghaoshenzhigengdidebianxieshiDAC,且能夠達到100dB的信噪比。
目前,帶多媒體功能的手機隻能播放MP3。下一步要做的也許是個人多媒體播放器,它們能把手機的功能和藍牙及Wi-Fi技術結合在一起。在此期間,PDA電話已經逐步進入領域,它提供了一些播放視頻或音頻文件的功能。
那是你口袋裏的合唱隊嗎?
Frith還表示,在過去,設計人員提供的手機隻有非常簡單的鈴聲或者MIDI鈴聲功能。有了MIDI,硬件解決方案總的來看已經發展成一個獨立的MIDI解碼器芯片。
雅馬哈是個典型的例子,芯片對MIDI文件進行解碼,並將解碼結果轉換成PCM音頻文件,隨後通過一個DAC把它們播放出來。這個DAC也許可以集成進該解碼芯片之中,當然也可以是分立的。做到這點的一個替代方法是把軟件MIDI解碼器植入電話處理器之中。
用戶對播放高質量鈴聲的興趣已經導致日本市場上的某些電話為其鈴聲選用了MP3文件。電話對它們的處理如同一個音樂設備對MP3文件的處理一樣。它們是通過高保真音頻係統來處理。

在目前的大部分電話之中,這個高保真係統是一個獨立的芯片,它含有一個立體聲DAC、一個立體聲ADC、若幹耳機和揚聲器驅動器、麥克風預放大器等等。但類似Wolfson這樣的公司目前尋求把所有這一切都集成在一起,以便該處理器可以實現語音播放和鈴聲、語音信號、藍牙連接以及更多的功能(參見圖3)。
- 音頻編解碼器技術解剖
- 個人音頻簡介
- 音頻編碼解碼器中後處理算法簡介
- 房間修正簡介
一些音頻編碼解碼器芯片主要由圍繞一些處理硬件的一個模數轉換器(ADC)和一個數模轉換器(DAC)組成,但它們隻是眾所周知的海底冰山露出來的一角。最近一段時間,大部分工程師認為音頻編解碼器就是在DSP平台上運行的壓縮和解壓縮算法。在整個音頻頻率範圍裏,“語音”編解碼器適合數字電話應用,而“音頻”編解碼器則適合娛樂音頻應用。
在這個意義上,音頻編解碼器是從Dolby公司的噪音抑製技術演變成Dolby和其它一些公司更綜合性的壓縮方法。它們的出現還與國際標準組織(ISO)的運動圖像專家小組(MPEG)有關,該工作小組負責為數字音頻和視頻的編碼表示製定相應的標準。
盡管語音編解碼器技術的發展一定程度上處於靜止狀態,但音頻編解碼器技術一直在向前演進(參見圖1)。例li如ru,朝chao更geng多duo的de環huan繞rao聲sheng通tong道dao發fa展zhan就jiu是shi一yi個ge趨qu勢shi。最zui大da的de一yi個ge技ji術shu趨qu勢shi是shi增zeng加jia了le用yong於yu模mo擬ni立li體ti聲sheng係xi統tong中zhong的de多duo通tong道dao音yin頻pin的de技ji術shu,以yi再zai造zao特te別bie實shi況kuang音yin樂le會hui會hui場chang的de“現場感”。於是產生了完成所有這些處理的挑戰,因為你不再能用依靠AV接收器或DVD播放器內的大功率電源供電的DSP引擎來實現,而必須用靠手機或PDA中的電池供電的DSP引擎來實現。所有上述因素就為兩個不同但卻融合的應用領域(個人音頻和家庭影院)帶來了一個有趣的故事。

個人音頻
德州儀器公司(TI)便攜音頻和信息娛樂業務部首席技術官RandyCole指出,在個人音頻領域最普遍的音頻編碼解碼器是MP3(參見圖2)。MP3一度局限於PC和he便bian攜xie多duo媒mei體ti播bo放fang器qi,但dan它ta目mu前qian在zai手shou機ji行xing業ye中zhong也ye比bi比bi皆jie是shi,其qi原yuan因yin就jiu是shi手shou機ji製zhi造zao商shang不bu斷duan地di追zhui逐zhu新xin功gong能neng,以yi誘you使shi最zui終zhong用yong戶hu每mei隔ge六liu個ge月yue就jiu進jin行xing一yi次ci產chan品pin換huan代dai。
MP3是ISO公布的一項標準。它是由MPEG製定的MPEG-1編碼解碼標準係列中的第三個。MPEG-1有三層,每一層都包括前麵的層。因而,第3層實現了第1和2層。出於這個原因,MPEG-1及第3層就是眾所周知的MP3,它提供了一個適於便攜應用的帶寬和數據速率,雖然較低卻足夠了。

在過去10年中,MP3一直是下載音樂的主導性音頻編碼解碼器。但是蘋果公司的iPod在一項名為先進音頻編碼器(AAC)的新MPEG開發項目中打破了這個慣例。MPEG在1990年代中期開始從事AAC標準的製定,將其作為下一代MPEG-2研究的一部分,並實現了AT&T、Dolby、Fraunhof和索尼公司開發的最好最新設計理念。起初,它打算同MP3後向兼容,但這個目標不可能達到。
因此,由於整個行業深深卷入MP3,沒有一家公司願意調撥資源為AAC這個新方案生產大量的音頻節目,所以它衰敗了。也就是說,直到蘋果公司為iPod選擇AAC的MPEG-4版本之前,該技術一直處於衰敗的狀態。(在MPEG-2之後成立的下一個MPEG工作小組是MPEG-4,越過了MPEG-3。蘋果公司所用的MPEG-4AAC是MPEG-2AAC的一個強化版本,其數據速率稍低而質量有改進。)
其它專有的編碼器存在於MP3和AAC範疇之外。它們在PC和(he)個(ge)人(ren)多(duo)媒(mei)體(ti)設(she)備(bei)領(ling)域(yu)有(you)一(yi)定(ding)的(de)穿(chuan)透(tou)性(xing),但(dan)它(ta)們(men)在(zai)手(shou)機(ji)行(xing)業(ye)就(jiu)不(bu)太(tai)重(zhong)要(yao),因(yin)為(wei)手(shou)機(ji)生(sheng)產(chan)商(shang)寧(ning)願(yuan)標(biao)準(zhun)的(de)編(bian)碼(ma)器(qi)及(ji)其(qi)固(gu)定(ding)的(de)版(ban)稅(shui)。一(yi)種(zhong)大(da)家(jia)熟(shu)悉(xi)的(de)專(zhuan)有(you)編(bian)碼(ma)器(qi)是(shi)WindowsMediaAudio(WMA)。它主要用於PC,並在其中與MP3和AAC進行競爭。然而,從數據速率看,它很靈活(從低到高有適當的質量差異)。目前,還有WMA的多頻道版本WMA-Pro,而且微軟公司在2005年6月還發布了一種損耗更低的WMA。
其它重要的專有編碼器就是DolbyDigital,也就是著名的AC3。這種編碼器用於DVD和(美國的)數字電視。直到最近,它的運行速率對互聯網和手機來說還是太高。不過,需要補救的是一個把數據速率降得更低的新版本。
根據TI公司高性能音頻業務部行銷經理MohsinImtiaz的觀點,在家庭影院領域主要的編碼解碼器是Dolby和DTS。Dolby公司發布的DolbyDigitalPlus瞄準了高清晰度DVD和廣播市場。但是在MP3、AAC、WMA等便攜標準之間有一定的交叉。針對下一代DVD,微軟公司正在力推WMA。
解析一個編解碼器
讓我們分解一個編解碼器。為了把整個事情說清楚,我們看一篇在2004年10月音頻工程學會年會上提交的論文,它描述的是DolbyDigitalPlus技術。[page]
該論文說新的DolbyDigitalPlus編碼解碼器是基於DolbyDigital的較早版本,也叫AC-3。DolbyDigitalPlus或加強型的AC-3(E-AC-3)保留了元數據載運器、過濾器庫和幀結構。目前的數據速率範圍從32Kb/s到6.144Mb/s。在采樣速率32KHz和六模塊轉換幀的條件下,數據速率控製的分辨率可達到每秒1/3位。(數據速率的分辨率正比於采樣速率,反比於幀的尺寸。)
E-AC-3保留了AC-3的六個256係數轉換幀結構,但它允許包含一個、兩個和三個256係數轉換模塊的較短幀存在。其結果就是,音頻傳輸可以在高於6?0Kb/s的速率下進行,這適合於某些限製了每幀數據量的DVD。
E-AC-3可以支持目前的5.1、6.1或7.1頻道,進而一直到電影院的13.1頻道。主音頻節目位流加上多達八個的附加子流經過多路選通進入一個單一的E-AC-3位流。通過頻道替換消除了矩陣減法引起的編碼失誤。與AC-3相比,E-AC-3能多傳輸七個獨立的位流。
編碼效率的提高還可以通過一個新的濾波器庫、更好的量化、強化的頻道耦合、譜擴展和一種名為“瞬態預噪音處理”的技術來實現。
當具有穩定特征的音頻出現時,該濾波器庫在現有的AC-3濾波器庫之後加入一個二級DCT。這把六個256係數轉換模塊轉換成一個單一的1536係數混合轉換模塊,且提高了頻率分辨率。這個提高的頻率分辨率與六維向量分量(VQ)及增益自適應分量(GAQ)結合在一起可以改進“難於編碼”信號的編碼效率,比如說黑管和大鍵琴。
VQ用於需要較低準確度的頻帶區。當需要更高準確度分量時,GAQ更有效率。此外,通過頻道與相位保存的耦合可以使編碼效率得到一個提升。在AC-3用(yong)一(yi)個(ge)高(gao)頻(pin)單(dan)合(he)成(cheng)頻(pin)道(dao)作(zuo)為(wei)每(mei)個(ge)頻(pin)道(dao)上(shang)高(gao)頻(pin)部(bu)分(fen)的(de)地(di)方(fang),加(jia)入(ru)相(xiang)位(wei)信(xin)息(xi)和(he)編(bian)碼(ma)器(qi)控(kong)製(zhi)的(de)譜(pu)幅(fu)度(du)處(chu)理(li)能(neng)夠(gou)讓(rang)這(zhe)個(ge)高(gao)頻(pin)單(dan)合(he)成(cheng)頻(pin)道(dao)處(chu)理(li)較(jiao)低(di)的(de)頻(pin)率(lv),從(cong)而(er)減(jian)小(xiao)了(le)有(you)效(xiao)的(de)編(bian)碼(ma)帶(dai)寬(kuan)並(bing)增(zeng)大(da)了(le)編(bian)碼(ma)效(xiao)率(lv)。
譜擴展是用頻域上轉換的較低頻譜段代替了較高層的頻率轉換係數。該轉換頻譜段的譜特征通過轉換係數的譜調製與原始的形式匹配。
為了提高低數據速率時的音頻質量,E-AC-3caiyongleshuntaiyuzaoyinchulijishu。zhegehoujiemaguochengbayuzaoyinwuchajiangdaozuidi,qizuofashicaiyongkesuoduanyuzaoyinchixushijiandeshibiaohechengjishu,yinerjiangdileshuntairaodongdeketingdu。youbianmaqijisuanbingzaiE-AC-3位流中發送的元數據提供了後解碼過程、時標合成處理所需的參數,時標合成處理使用了聽覺情景分析技術。
後處理
用於音頻編碼解碼器中後處理的專有算法與DolbyDigitalPluszheleiyasuobiaozhunyiyangzhongyao,tamenduirenheshouxukerenyexiangtong。zaizhegelingyuzhong,zhexiesuanfaduiduopindaobiaozhunxiedaidexinxijinxingcaozuo,congerbajiatingyingyuanzhuanhuachengrenhexingshideshoutingchangsuo:從一個巨大的教堂到一個爵士音樂俱樂部的戶外搖滾音樂會。
按照ADI公司SigmaDSP產品經理ThomasIrrgang的說法,後處理全都是圍繞著OEM商追求一個“簽名聲音”的願望開展的。大概最先做成功這點的是THX公司。其它開展後處理研究的公司包括SRS、TruSurroundXT和TruBass。
在電視領域有能夠複原MP-3編碼損失的後處理器BBE,包括BBE3D和BBEMP。還有一種專門用於電視的算法BBEViva,在電視中立體聲話筒一般放置的非常近以便獲得良好的立體聲收聽效果。
低音增強在便攜係統和電視機中正變得重要起來,這些設備不會給大的話筒驅動器留有大的空間。目前最突出的是WAVES公司的MaxxBass算法,它大概也是最流行的低音增強算法,因為它增強了正被處理材料中低音的主觀感受水平,同時又不加入任何低頻能量。
Dolby公司在後處理領域以其VirtualSpeaker(虛擬話筒)和DolbyHeadphone(Dolby耳麥)算法而聞名於世。Dolby公(gong)司(si)表(biao)示(shi)其(qi)技(ji)術(shu)複(fu)製(zhi)了(le)多(duo)個(ge)所(suo)以(yi)聲(sheng)音(yin)簽(qian)名(ming),包(bao)括(kuo)反(fan)射(she),同(tong)時(shi)提(ti)供(gong)了(le)串(chuan)擾(rao)抵(di)消(xiao),以(yi)便(bian)保(bao)持(chi)每(mei)個(ge)耳(er)朵(duo)的(de)環(huan)繞(rao)音(yin)質(zhi)不(bu)被(bei)其(qi)它(ta)話(hua)筒(tong)的(de)環(huan)繞(rao)音(yin)質(zhi)所(suo)抵(di)消(xiao)。虛(xu)擬(ni)話(hua)筒(tong)和(he)Dolby耳麥算法最初是由澳大利亞的LakeDSP公司開發的。Lake現在是Dolby的一家分公司。
當然,天下沒有免費的午餐。諸如虛擬話筒這樣的算法隻能在一個相對小的室內空間(俗稱“甜場”)中模仿缺失話筒的存在。在這個“甜場”之外,環繞信息崩潰了。該聲音不算壞,但聽起來它來自一個常規的雙耳話筒設置,情況就是這樣。
為了重新生成一個物理空間,Panasonic公司的網站上說,其HallMode(大廳模式)“再生了回響效果,使聽眾有一種空曠之音繞著自己傳播的感覺,”而且它在“享受音樂廳內的交響樂表演時的效果尤其好。”一個雅馬哈A/V接收器的評論家認為雅馬哈的音樂廳“的確加入了額外的一維,使人感到聲場的高度,‘音樂廳模式’甚至讓你忍不住要嚐試一下。對於令人喜愛的Mahler第四交響樂的立體聲錄音,‘音樂廳模式’給人一種親臨現場的感覺。”
房間修正
在後處理領域,超越虛擬化的下一步就是房間修正。這個功能開始出現於2002年或2003年的高端多頻道係統中,而且目前已經發展到處於價格/性能譜係中端的係統。它對一套公寓樓內家庭影院係統的用戶滿意度至關重要,因為在家庭影院係統中不可能對稱設置左、youhuatong,huozheshuofangjianneiyiduqiangdeshengxuexingnengbutongyutaduimianqiangdeshengxuexingneng。duopindaoxitongcongfangjianxiuzhengjishuzhonghuoyizuiduo。tayexuduiliangpindaoshezhideyingxiangjiaoxiao,danlitishengxitongyibanshuolaiduiwutiaozhenghewuxiaozhunbunamemingan。
房間修正涉及到把該係統調整為TEST(測試)模(mo)式(shi),在(zai)最(zui)喜(xi)歡(huan)的(de)傾(qing)聽(ting)位(wei)置(zhi)處(chu)放(fang)一(yi)個(ge)麥(mai)克(ke)風(feng),並(bing)播(bo)放(fang)出(chu)一(yi)係(xi)列(lie)測(ce)試(shi)聲(sheng)音(yin)以(yi)便(bian)弄(nong)清(qing)楚(chu)房(fang)間(jian)聲(sheng)學(xue)性(xing)能(neng)方(fang)麵(mian)的(de)信(xin)息(xi)和(he)話(hua)筒(tong)本(ben)身(shen)的(de)局(ju)限(xian)性(xing),隨(sui)後(hou)根(gen)據(ju)專(zhuan)有(you)算(suan)法(fa)調(tiao)整(zheng)增(zeng)益(yi)和(he)均(jun)衡(heng)度(du)。對(dui)於(yu)房(fang)間(jian)整(zheng)定(ding)技(ji)術(shu),一(yi)個(ge)令(ling)人(ren)感(gan)興(xing)趣(qu)的(de)交(jiao)叉(cha)領(ling)域(yu)是(shi)汽(qi)車(che)應(ying)用(yong)。多(duo)年(nian)來(lai),一(yi)直(zhi)在(zai)對(dui)昂(ang)貴(gui)汽(qi)車(che)內(nei)OEM的音響係統進行聲學調整以便獲得最佳性能,但這是一個相當費力而且相當主觀的人工過程。
qichezhizaoshangyijingkaishicaiyongzidongdetingjiaokongjiantiaozheng。shijianzhengming,chulefengfudetingjiaojingyanwai,zheleitiaozhengyigezuizhongyaodefangmianjiushishengxueshangdehuiyindixiao。zheyiweizhexiaochucongmianshounahuatongdaoanzhuangzaitaiyangmaohuotoudingchumaikefengdefankui。
手機和個人多媒體設備的融合
MP3和AAC數據速率對個人多媒體播放器及PC是(shi)恰(qia)當(dang)的(de)。但(dan)對(dui)於(yu)手(shou)機(ji)來(lai)說(shuo),數(shu)據(ju)速(su)率(lv)必(bi)須(xu)要(yao)低(di)一(yi)些(xie)。而(er)且(qie)顯(xian)而(er)易(yi)見(jian)的(de)是(shi),與(yu)下(xia)載(zai)音(yin)樂(le)文(wen)件(jian)以(yi)便(bian)稍(shao)後(hou)播(bo)放(fang)相(xiang)比(bi),通(tong)過(guo)蜂(feng)窩(wo)網(wang)鏈(lian)接(jie)的(de)流(liu)音(yin)頻(pin)有(you)著(zhe)很(hen)不(bu)同(tong)的(de)需(xu)求(qiu)。
由第3代合作規劃委員會(3GPP)製訂的3G手機標準采用AAC作為音頻編碼解碼器標準,可滿足了這兩類應用的要求。該標準最新的修改版(版本6)允許使用兩種音頻編碼解碼器中的任何一種。一種就是AAC的強化版,叫做AAC-Plus或高效率AAC(HE-AAC)。
前不久,強化AAC-Plus或高效率AAC的第二套改進版(版本2)也添加進來。另一種選擇是“AMRWidebandPlus”,它是一種強化的語音編碼器。對GSM手機來說,AMR寬帶是一種非常流行的語音編碼器。其Plus改進版將其應用擴展到可處理音樂。
蘇格蘭的Wolfson微電子公司從事硬件音頻編碼解碼器的製造,該公司新產品開發部的副總裁PeterFrith指出,給手機加入回放MP3degongneng,huozheyongyuxiazaiyinle,huozhezuoweigaozhiliangdelingsheng,yiweizheyonghuyijingxiwangzaishoujizhongkandaoyigexiangduigaobaozhendehuifangxitong。yinci,shoujizhizaoshangmuqianqipanchuxiangonghaoshenzhigengdidebianxieshiDAC,且能夠達到100dB的信噪比。
目前,帶多媒體功能的手機隻能播放MP3。下一步要做的也許是個人多媒體播放器,它們能把手機的功能和藍牙及Wi-Fi技術結合在一起。在此期間,PDA電話已經逐步進入領域,它提供了一些播放視頻或音頻文件的功能。
那是你口袋裏的合唱隊嗎?
Frith還表示,在過去,設計人員提供的手機隻有非常簡單的鈴聲或者MIDI鈴聲功能。有了MIDI,硬件解決方案總的來看已經發展成一個獨立的MIDI解碼器芯片。
雅馬哈是個典型的例子,芯片對MIDI文件進行解碼,並將解碼結果轉換成PCM音頻文件,隨後通過一個DAC把它們播放出來。這個DAC也許可以集成進該解碼芯片之中,當然也可以是分立的。做到這點的一個替代方法是把軟件MIDI解碼器植入電話處理器之中。
用戶對播放高質量鈴聲的興趣已經導致日本市場上的某些電話為其鈴聲選用了MP3文件。電話對它們的處理如同一個音樂設備對MP3文件的處理一樣。它們是通過高保真音頻係統來處理。

特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 三星上演罕見對峙:工會集會討薪,股東隔街抗議
- 摩爾線程實現DeepSeek-V4“Day-0”支持,國產GPU適配再提速
- 築牢安全防線:智能駕駛邁向規模化應用的關鍵挑戰與破局之道
- GPT-Image 2:99%文字準確率,AI生圖告別“鬼畫符”
- 機器人馬拉鬆的勝負手:藏在主板角落裏的“時鍾戰爭”
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
NFC
NFC芯片
NOR
ntc熱敏電阻
OGS
OLED
OLED麵板
OmniVision
Omron
OnSemi
PI
PLC
Premier Farnell
Recom
RF
RF/微波IC
RFID
rfid
RF連接器
RF模塊
RS
Rubycon
SATA連接器
SD連接器
SII
SIM卡連接器
SMT設備
SMU
SOC
SPANSION

