首页 理论教育 数字音频技术

数字音频技术

时间:2022-03-10 理论教育 版权反馈
【摘要】:由于以上优点,现在绝大多数的教学音频素材都采用数字音频技术。由于话筒录制的声音信号是用模拟波形表示的,所以数字音频技术首先要将模拟信号转成数字符号。CD记录的是非压缩的数字音频文件,74分钟的CD格式音频文件要占用747M字节的空间,大概为每分钟10M字节。为了降低数据量,可以采用压缩技术。图43显示的MP3文件数据率是192Kbps,以这个数据率压缩成的音频文件,每分钟需要约1.4M字节的存储空间。

4.1.3 数字音频技术

1.数字音频技术的特点

数字音频技术就是将模拟的波形音频信号转化成一个个的数据。数字音频技术的优点包括:

(1)采用数字信号后,抗干扰能力强,多次复制不会降低音频质量,提升了音频文件质量;(2)数字形式的音频文件可以在计算机上方便的传输和编辑,大大降低了音频材料的制作难度;(3)随着数字技术的提升,小巧而又灵活的数字音频设备极大地方便了音频材料的教学使用。由于以上优点,现在绝大多数的教学音频素材都采用数字音频技术。

常用数字音频格式用到的参数有三个,分别是采样频率、量化级数和数据率:

(1)采样频率。由于话筒录制的声音信号是用模拟波形表示的,所以数字音频技术首先要将模拟信号转成数字符号。如图4‐2所示,按一定的频率间隔来采集模拟波形的数据,这个频率间隔称为采样频率,是指1秒内的采样个数,也就是图中的t0,t1,t2等点的个数。

采样频率越高,相同时间段内的数据点就越多,能描述的模拟声音波形的最高频率也就越高。基本规则是采样频率必须大于要保留的模拟信号最高频率的2倍以上。例如,如果要保留最高频率为5500Hz的声音,那么采样频率必须大于5500Hz的一倍即11000Hz。

img54

图4‐2 数字音频采样原理

(2)量化级数。数字音频采样的另一个重要指标是量化级数,实际上就是每个采样点的精度,用bit表示,常用的是8bit(2的8次方)和16bit(2的16次方)。显然,与8bit量化级数相比,使用16bit量化级数的数字音频具有更高的精度,因此也具有更大的动态范围。动态范围是指记录声音的最大值和最小值之间的比。显然这个值越大,越能反映被记录音频文件的跌宕起伏。

普通录音磁带的动态范围约为46dB,而CD的动态范围为96dB,远远高于录音机的记录范围。

(3)数据率。数据率又称码率,指数字化记录的声音的数据量大小。用每秒多少位来计算。

在Windows操作系统中,对于系统识别的音频格式,如WAV或MP3文件,可以直接查看其主要数据。选中文件后,鼠标右击,选择摘要,再点击高级,可以看到该音频文件的采样频率和数据率(如图4‐3所示)。

img55

图4‐3 音频文件属性查看

我们常用的CD音频文件,采样频率是44100Hz,因此其可以保留的模拟音频文件的最高频率是它的一半22050Hz。CD的量化级数为16bit,折算成分贝是96dB,也就是说CD音质的文件的动态范围是96dB。

普通的CD刻录盘的容量为700MB,在刻录制作CD光盘时,每张CD的音频文件的长度最好不要超过70分钟,以免造成部分音频刻录失败。

2.数字音频的压缩与格式转换

非压缩的数字音频文件的数据量是比较大的,其数据量计算可参见本章附录一。CD记录的是非压缩的数字音频文件,74分钟的CD格式音频文件要占用747M字节的空间,大概为每分钟10M字节。为了降低数据量,可以采用压缩技术。采用不同的压缩技术,就会产生不同格式的音频文件,如表4‐1所示。

表4‐1 常用音频文件格式

img56

对于压缩的音频文件,压缩率越高,数据率越低,音质越差。其具体计算参见本章附录一。

在这些格式中,WAV和MP3的兼容性最好,几乎所有的多媒体著作软件和声音编辑软件都支持,WMA也获得较多软件支持。压缩效率较高的是MP4和WMA。RM格式由于格式的封闭性,现已用得较少。

图4‐3显示的MP3文件数据率是192Kbps,以这个数据率压缩成的音频文件,每分钟需要约1.4M字节的存储空间。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈