MP3壓縮編碼技術

MP3壓縮編碼使用了5種重要的技術：最小聽覺門限判定(Minimal Audition Threshold)、掩蔽效應(Masking Effect)、位儲存槽(Reservoir of Bytes)、聯合立體聲(JointStereo)和霍夫曼編碼(Huffman Code)。　　最小聽覺門限判定是一種減少信息量的手段，可以將大部分記錄信息集中在人耳最敏感的2～5kHz範圍，其餘頻率則分配較少的容量記錄。　　掩蔽效應是一種心理聲學模型，在聽覺上表現為有一個音量或音色特別突出的聲音出現時，其它細小的聲音會變得難以被察覺，因而沒有必要對所有的聲音細節都進行編碼，而只需對容易引起注意的聲音編碼。　　位儲娌?筋P3的流量屬性，分為恆定比特率(CBR)和可變比特率(VBR)。CBR指文件每秒的信息流量固定不變，常見的MP3音頻都是以CBR方式編碼的，其優點是壓縮速度快；缺點是由於每秒的信息流量相同，容易造成空間的浪費。VBR指文件每秒的信息流量可以變化，其優點是在信號複雜時用較多的容量記錄，信號簡單時用較少的容量記錄以有效利用空間。通過位儲存槽，將CBR編碼的MP3音頻，在波形簡單時用較少的容量記錄，把多餘的空間用於記錄複雜的波形，維持流量的大小，以達到近似於VBR編碼的效果。而用VBR編碼的MP3音頻則不需要位儲存槽。　　聯合立體聲是一種立體聲編碼技術，主要分為強度立體聲(Intensity Stereo, IS)和中側立體聲(Mid/Side Stereo, M/S)兩種。IS在流量比較低時使用，利用人類聽覺系統對高頻信號相位分辨能力不強的特點，將音頻信號中的低頻分離出來合成單聲道信息，其餘的高頻信息合成另一個單聲道信息，並通過另外記錄高頻信號的位置信息來重建立體聲效果。M/S常被用於左右聲道大體相似的情況，先將左右聲道相加(L+R)得到一個聲道，再將左右聲道相減(L-R)得到另一個聲道，然後將這兩個聲道信息通過心理聲學模型和濾波器處理。M/S與IS一樣，是以損失部分相位信息為代價而獲得較高音色記錄信息的方法。一般地，在MP3音頻編碼中M/S和IS是交替使用的，視信息內容和流量而定。如果是更高流量如160kb/s以上的MP3 音頻，則可以對立體聲的兩個聲道獨立編碼，以保存相位信息。　　霍夫曼編碼是一種常見的無失真壓縮方案。在脈衝編碼調製信號(PCM)被分成多個臨界頻帶並經過以上處理後，經過混合多相修飾離散餘弦變換(MDCT)，將波形轉換為一連串的係數，最終經過霍夫曼編碼再次實現壓縮。

收藏分享評分

回復引用

訂閱 TOP

返回列表