数字音频技术

时间：2023-03-10 理论教育版权反馈

【摘要】：由于以上优点，现在绝大多数的教学音频素材都采用数字音频技术。由于话筒录制的声音信号是用模拟波形表示的，所以数字音频技术首先要将模拟信号转成数字符号。CD记录的是非压缩的数字音频文件，74分钟的CD格式音频文件要占用747M字节的空间，大概为每分钟10M字节。为了降低数据量，可以采用压缩技术。图43显示的MP3文件数据率是192Kbps，以这个数据率压缩成的音频文件，每分钟需要约1.4M字节的存储空间。

4.1.3　数字音频技术

1.数字音频技术的特点

数字音频技术就是将模拟的波形音频信号转化成一个个的数据。数字音频技术的优点包括：

（1）采用数字信号后，抗干扰能力强，多次复制不会降低音频质量，提升了音频文件质量；（2）数字形式的音频文件可以在计算机上方便的传输和编辑，大大降低了音频材料的制作难度；（3）随着数字技术的提升，小巧而又灵活的数字音频设备极大地方便了音频材料的教学使用。由于以上优点，现在绝大多数的教学音频素材都采用数字音频技术。

常用数字音频格式用到的参数有三个，分别是采样频率、量化级数和数据率：

（1）采样频率。由于话筒录制的声音信号是用模拟波形表示的，所以数字音频技术首先要将模拟信号转成数字符号。如图4‐2所示，按一定的频率间隔来采集模拟波形的数据，这个频率间隔称为采样频率，是指1秒内的采样个数，也就是图中的t₀，t₁，t₂等点的个数。

采样频率越高，相同时间段内的数据点就越多，能描述的模拟声音波形的最高频率也就越高。基本规则是采样频率必须大于要保留的模拟信号最高频率的2倍以上。例如，如果要保留最高频率为5500Hz的声音，那么采样频率必须大于5500Hz的一倍即11000Hz。

图4‐2　数字音频采样原理

（2）量化级数。数字音频采样的另一个重要指标是量化级数，实际上就是每个采样点的精度，用bit表示，常用的是8bit（2的8次方）和16bit（2的16次方）。显然，与8bit量化级数相比，使用16bit量化级数的数字音频具有更高的精度，因此也具有更大的动态范围。动态范围是指记录声音的最大值和最小值之间的比。显然这个值越大，越能反映被记录音频文件的跌宕起伏。

普通录音磁带的动态范围约为46dB，而CD的动态范围为96dB，远远高于录音机的记录范围。

（3）数据率。数据率又称码率，指数字化记录的声音的数据量大小。用每秒多少位来计算。

在Windows操作系统中，对于系统识别的音频格式，如WAV或MP3文件，可以直接查看其主要数据。选中文件后，鼠标右击，选择摘要，再点击高级，可以看到该音频文件的采样频率和数据率（如图4‐3所示）。