返回列表 回復 發帖

MP3壓縮編碼技術

MP3壓縮編碼使用了5種重要的技術:最小聽覺門限判定(Minimal Audition Threshold)、掩蔽效應(Masking Effect)、位儲存槽(Reservoir of Bytes)、聯合立體聲(JointStereo)和霍夫曼編碼(Huffman Code)。   最小聽覺門限判定是一種減少信息量的手段,可以將大部分記錄信息集中在人耳最敏感的2~5kHz範圍,其餘頻率則分配較少的容量記錄。   掩蔽效應是一種心理聲學模型,在聽覺上表現為有一個音量或音色特別突出的聲音出現時,其它細小的聲音會變得難以被察覺,因而沒有必要對所有的聲音細節都進行編碼,而只需對容易引起注意的聲音編碼。   位儲娌?筋P3的流量屬性,分為恆定比特率(CBR)和可變比特率(VBR)。CBR指文件每秒的信息流量固定不變,常見的MP3音頻都是以CBR方式編碼的,其優點是壓縮速度快;缺點是由於每秒的信息流量相同,容易造成空間的浪費。VBR指文件每秒的信息流量可以變化,其優點是在信號複雜時用較多的容量記錄,信號簡單時用較少的容量記錄以有效利用空間。通過位儲存槽,將CBR編碼的MP3音頻,在波形簡單時用較少的容量記錄,把多餘的空間用於記錄複雜的波形,維持流量的大小,以達到近似於VBR編碼的效果。而用VBR編碼的MP3音頻則不需要位儲存槽。   聯合立體聲是一種立體聲編碼技術,主要分為強度立體聲(Intensity Stereo, IS)和中側立體聲(Mid/Side Stereo, M/S)兩種。IS在流量比較低時使用,利用人類聽覺系統對高頻信號相位分辨能力不強的特點,將音頻信號中的低頻分離出來合成單聲道信息,其餘的高頻信息合成另一個單聲道信息,並通過另外記錄高頻信號的位置信息來重建立體聲效果。M/S常被用於左右聲道大體相似的情況,先將左右聲道相加(L+R)得到一個聲道,再將左右聲道相減(L-R)得到另一個聲道,然後將這兩個聲道信息通過心理聲學模型和濾波器處理。M/S與IS一樣,是以損失部分相位信息為代價而獲得較高音色記錄信息的方法。一般地,在MP3音頻編碼中M/S和IS是交替使用的,視信息內容和流量而定。如果是更高流量如160kb/s以上的MP3 音頻,則可以對立體聲的兩個聲道獨立編碼,以保存相位信息。   霍夫曼編碼是一種常見的無失真壓縮方案。在脈衝編碼調製信號(PCM)被分成多個臨界頻帶並經過以上處理後,經過混合多相修飾離散餘弦變換(MDCT),將波形轉換為一連串的係數,最終經過霍夫曼編碼再次實現壓縮。
返回列表