信源编码的应用

时间：2022-10-10 百科知识版权反馈

【摘要】：波形编解码以语音信号波形的重建为目的，力图使重建波形接近原始信号波形。参量编码通过对语音信号的某一特征参量的提取及编码，力图重建一个新的与原信号声音相似，但波形不尽相同的语音信号，实现这一过程的系统成为声码器。语音的参量编码主要用于移动通信系统等利用无线信道的通信设备中。

2.2.4　信源编码的应用

1.语音编码

语音编码的目的是在保持一定算法复杂度和通信延时的前提下，利用尽可能少的信道容量，传送质量尽可能高的话音。

（1）语音编码的性能指标

衡量一种语音编码方法的好坏，通常需要考虑多方面因素，如语音质量、编码速率、编解码延时和算法复杂度等。

①语音质量。语音的质量与语音的带宽有关，一般来说频率范围越宽，语音质量也就越高。在不同的应用场合，对音质的要求有所不同，如表2-4所示。

表2-4　声音类型与带宽

评价语音编码质量的方法一般有两种：主观评定和客观评定。主观评定是依照人们对语音质量的感觉来评定，该方法主观性较强，可靠性不高；客观评定是对语音性能的某些参数进行定量分析后得出的结论，评定方法相对标准，但往往忽略了人对语音质量的感觉。目前，专家学者正努力寻找更加符合主观感知的客观评定方法。

②编码速率

编码速率是指模拟信号经过抽样、量化和编码之后产生的数字信号的信息传输速率，如电话系统按照8 000Hz进行话音抽样，每个样值用8位二进制代码表示，因此该系统编码速率为64kbit/s。显然，用越多的二进制位数表示一个样值，语音的质量就越高，但是，相应地对传输速度、带宽、存储容量的要求也越高。

③算法复杂度

通常而言，复杂的编解码算法可以提高语音质量或降低编码速率，但是却提高硬件实现的复杂度，增加整体成本……因此，在实际应用中，一般在保持一定语音质量的前提下尽可能降低运算的复杂度。

④编解码延时

系统延时除包括传输延时外，还包括由于对语音信号的分帧处理以及复杂的算法所产生的编解码延时。在实时语音通信系统中，若总延时过长，将会影响双方的正常交谈，因此希望尽可能减少延时时间，一般要求语音编解码的延时低于100ms。

（2）语音编码的分类

根据编码器的实现机理，可将语音编码大致分为三类：波形编码、参量编码和混合编码。

波形编码是从语音信号波形出发，对波形的采样值、预测值或预测误差值进行编码。波形编解码以语音信号波形的重建为目的，力图使重建波形接近原始信号波形。该编码方式重建语音质量好，但编码速率较高。常用的波形编码方法包括PCM、DM、ADPCM等。

参量编码通过对语音信号的某一特征参量的提取及编码，力图重建一个新的与原信号声音相似，但波形不尽相同的语音信号，实现这一过程的系统成为声码器。线性预测编码（LPC）是最常用的语音编码方法，它是利用相邻样点之间的相关性，用过去的样点的线性组合预测未来的样点，用式（2-1）表示。

其中（n）语音信号的预测值；s （n）语音信号；a_i预测器系数；p预测器阶数。

语音的参量编码主要用于移动通信系统等利用无线信道的通信设备中。该方法的优点是可懂度较高，但合成语音自然度不够好，抗背景噪声能力较差。

混合编码是在波形和参量编码的基础上提出来的，既克服了上述两种编码的弱点，又结合了它们的长处，能在中低速率上实现高质量的重建语音。常用的混合编码包括多脉冲线性预测编码（MP-LPC）、码激励线性预测编码（CELP）等。

（3）语音编码的国际标准

为了使信息管理系统具有普遍的互操作性，并确保未来的兼容性，目前，ITU-T（国际电信联盟远程通信标准化组织，前身是CCITT——国际电报电话咨询委员会）提出了若干有关语音编码的建议，其中第2.2.1节介绍的PCM是最早的语音编码标准，自此之后，各种新的编码标准不断涌现，表2-5列出了部分语音编码标准。

表2-5　语音编码的国际标准

随着移动电话的普及，各地区性组织先后制定了一系列标准，但目前尚未统一的国际标准。欧洲电信标准协会（ETSI）公布了GSM全速率（FR）语音标准（主要采用RPE-LP编码算法）、半速率（HR）语音编码标准、增强的全速率（EFR）编码标准和自适应多速率（AMR）语音编码标准（WCDMA和TD-SCDMA也均采用AMR编码标准）；电子工业协会（EIA）下属的北美电信工业协会（TIA）采纳了QCELP作为过渡语音编码标准IS-96-A，之后又颁布了IS-127的增强型变速率（EVRC）语音编码标准等；美国通信工业协会（TIA）为适应新一代移动通信CDMA2000规定了的变速率语音编解码标准EVRC等。

2.图像编码

与语音编码类似，对图像进行压缩编码之前，首选需要对图像信号进行抽样和量化。与对语音信号抽样不同的是，由于图像信号是二维的，通常采用等间隔的点阵抽样方式，即在x方向上取M点，在y方向上取N点，读取整个图像函数空间内M×N个离散点的值，从而得到一个用样点值所表示的阵列。图像量化的基本要求为在量化噪声足够小的前提下，用最少的量化电平进行量化，常用的图像量化方式是均匀量化。

图像信号经过抽样、量化后，得到的数字图像中各个像素彼此之间的相关性很大。例如，在电视画面中，同一行中相邻两个像素或相邻两行间的像素，其相关系数可以达到0.9。因此，数字图像中存在信息冗余，进行图像压缩的潜力非常大。

图像压缩编码的核心思想是：①消除像素点间数据的相关性；②利用人眼的视觉生理特征和图像的概率统计模型进行自适应量化编码。

人眼的视觉延迟

人眼的视觉暂留为16～24次/秒，因此只要以30次/秒或更短的时间间隔来更新屏幕画面，就可以骗过人的眼睛，让我们以为画面没有变过。虽然如此，实际上30次/秒的屏幕刷新率所产生的闪烁现象，我们的眼睛仍然能够察觉，从而产生疲劳的感觉。屏幕的刷新率越高，画面越稳定，使用者感觉越舒适。一般屏幕刷新率在75次/秒以上，人眼就完全觉察不到了，所以建议将屏幕刷新率设定在75Hz～85Hz。

（1）图像编码的性能指标

图像编码的性能指标主要包括压缩效率（压缩前后编码速率的比值）、压缩质量（指恢复图像的质量）、编解码算法的复杂度、编解码延时等。

（2）图像编码的分类

根据编码过程是否存在信息损耗，图像编码可以分为有损压缩和无损压缩。

根据恢复图像的准确度，可以分为信息保持编码（主要应用于图像的数字存储，属于无损压缩）、保真度编码（主要应用于数字电视技术和多媒体通信领域，属于有损压缩）、特征提取编码（主要应用于图像识别、分析和分类，属于有损编码）。

根据图像压缩的实现方式，可以分为变换编码（如离散傅里叶变换）、概率匹配编码（如霍夫曼编码）、预测编码（如DPCM）等。

近年来，图像编码技术取得了迅速的发展和广泛的应用，一些新的压缩方法（如小波编码、分形编码等）不断被提出。

（3）图像编码的国际标准

在这些编码方法的基础上，目前已经制定了一系列图像编码的国际标准，主要包括：

①静止图像编码标准（如JPEG和JPEG-2000等）；

②活动图像编码标准（如MPEG-2一般视频编码标准、MPEG-4多媒体通信编码标准、AVS等）；

③多媒体会议标准（如H.261、H.263等）。此外，在互联网上被广泛应用的还有Real-Networks的Real Video、Apple公司的Quick Time等。其中，AVS是我国拥有自主知识产权的第二代信源编码标准，是《信息技术先进音视频编码》系列标准的简称，其包括系统、视频、音频、数字版权管理等四个主要技术标准和符合性测试等支撑标准。与其他现有图像编码标准相比，AVS与MPEG-4第10部分的H.264能在相同的带宽下提供更加优秀的图像质量，但AVS的算法复杂度和软硬件实现成本都远低于H.264。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈