首页 百科知识 子带编码()

子带编码()

时间:2022-10-05 百科知识 版权反馈
【摘要】:于是就产生了子带编码,概括地来说子带编码的基本思想是:使用一组带通滤波器把输入音频信号的频带分成若干个连续的频段,每个频段称为子带。子带编码器SBC愈来愈受到重视。使用子带编码技术的编译码器已开始用于话音存储转发和话音邮件,采用2个子带和ADPCM的编码系统也已由CCITT作为G.722标准向全世界推荐使用。MPEG-1的音频标准也使用子带编码来达到既压缩声音数据又尽可能保留声音原有质量的目的。

人耳对声音信号的判断是与信号频率有关的。例如人耳对1kHz频率的信号尤其敏感。有实验结果表明,如果人发出无意义的音节,如果只保留400Hz~6kHz频率范围的语音信号,那么听话人就可以听清此音节;如果把上限降至1.7kHz则可听清一半;如果要听清连续有意义的句子,那么只要保留频率在400~3000Hz,语音就可以完全听懂。与人耳听觉特性在频率上发布不均匀相对应,人所发出的语音信号的频率也不是平坦的。事实上多数人的语音能量,主要集中在频率范围500~1000Hz,并随着频率的升高很快衰减。

根据上述特性可以将输入信号用某种方法划分成不同频段上的子信号,然后区别对待。根据各子信号的特性,分别编码。比如对语音信号能量大的、比较集中的、对听觉有重要影响的分配较多的码字,次要信号则分配较少的码字。各子信号分别编码后的码字被传送到接收方,再被分别解码,最后合成出相应的解码语音。

于是就产生了子带编码(SubBand Coding,缩写为SBC),概括地来说子带编码的基本思想是:使用一组带通滤波器(Band-Pass Filter,缩写为BPF)把输入音频信号的频带分成若干个连续的频段,每个频段称为子带。与音源特定编码法不同,SBC的编码对象不局限于话音数据,也不局限于哪一种声源。这种方法是首先把时域中的声音数据变换到频域,对频域内的子带分量分别进行量化和编码,根据心理声学模型确定样本的精度,从而达到压缩数据量的目的。在信道上传送时,将每个子带的代码复合起来。在接收端译码时,将每个子带的代码单独译码,然后把它们组合起来,还原成原来的音频信号。子带编码的方块图如图 5.3所示,图中的编码/译码器,可以采用ADPCM、APCM、PCM等。

图5.3 子带编码方块图

采用对每个子带分别编码的好处有两个。第一,对每个子带信号分别进行自适应控制,量化阶(quantization step)的大小可以按照每个子带的能量电平加以调节。具有较高能量电平的子带用大的量化阶去量化,以减少总的量化噪声。第二,可根据每个子带信号在感觉上的重要性,对每个子带分配不同的位数,用来表示每个样本值。例如,在低频子带中,为了保护音调和共振峰的结构,就要求用较小的量化阶、较多的量化级数,即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的位数。

音频频带的分割可以用树型结构的式样进行划分。首先把整个音频信号带宽分成两个相等带宽的子带:高频子带和低频子带。然后对这两个子带用同样的方法划分,形成4个子带。这个过程可按需要重复下去,以产生2K个子带,K为分割的次数。用这种办法可以产生等带宽的子带,也可以生成不等带宽的子带。例如,对带宽为4000Hz的音频信号,当K=3时,可分为8个相等带宽的子带,每个子带的带宽为500Hz。也可生成5个不等带宽的子带,分别为[0,500]、[500,1000]、[1000,2000]、[2000,3000]和[3000,4000]。

把音频信号分割成相邻的子带分量之后,用2倍于子带带宽的采样频率对子带信号进行采样,就可以用它的样本值重构出原来的子带信号。例如,把4000Hz带宽分成4个等带宽子带时,子带带宽为1000Hz,采样频率可用2000Hz,它的总采样率仍然是8000Hz。

子带编码器SBC愈来愈受到重视。在中等速率的编码系统中,SBC的动态范围宽、音质高、成本低。使用子带编码技术的编译码器已开始用于话音存储转发(voice store-and-forward)和话音邮件,采用2个子带和ADPCM的编码系统也已由CCITT作为G.722标准向全世界推荐使用。MPEG-1的音频标准也使用子带编码来达到既压缩声音数据又尽可能保留声音原有质量的目的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈