首页 理论教育 数字音频技术基础

数字音频技术基础

时间:2022-04-25 理论教育 版权反馈
【摘要】:3.1 数字音频技术基础声音是一种能量波,因此它有频率和振幅的特征,频率对应于时间轴,振幅对应于幅度轴。通常来说,采样率越高,单位时间内对声音采样的次数就越多,获得的声音信息也就越完整,音质就越好。只要播放时的采样率和文件的采样率一致,那么,声音的音调和节拍就不会改变,当然,采样率越低,音质越差。

3.1 数字音频技术基础

声音是一种能量波,因此它有频率和振幅的特征,频率对应于时间轴,振幅对应于幅度轴。声波可以看成由无数点组成的无限光滑的波形,由于存储空间是相对有限的,在数字编码过程中,必须对声波的点进行采样。采样就是将模拟音频信号转换为数字音频信号的过程,采样率就是单位时间内对音频信号进行采集的次数,它以赫兹(Hz)或千赫兹(kHz)为单位。通常来说,采样率越高,单位时间内对声音采样的次数就越多,获得的声音信息也就越完整,音质就越好。很显然,在1秒钟内抽取的点越多,获取的频率信息就越丰富。为了复原波形,一次振动中,必须至少有2个点的采样。人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉特性的需求,则需要至少每秒进行40 000次采样,用40kHz表达。我们常用的CD音频格式,其采样率为44.1kHz,即每秒要对声音进行44 100次采样。光有频率信息是不够的,还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD为16bit的采样分辨率,即2的16次方。采样分辨率相对采样率更难理解,因为它更抽象一些。举个简单例子,假设对一个波进行8次采样,采样点对应的能量值分别为A1—A8,但我们只使用2bit的采样分辨率,结果我们只能保留A1—A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。采样率和采样分辨率的值越大,记录的波形越接近原始信号。

一般来说,只能把高采样率的音频文件转换成低采样率的文件,而把低采样率的音频文件变成高采样率的文件,就相当于想要把VCD格式的图像直接转换成DVD的图像,是不可能的,会出现失真类型的噪音。

MP3文件的基本采样率是44 100Hz,如果转换成8 000Hz的WAV格式文件,文件会小很多,但音质肯定会差很多。在转换后播放时,应注意播放的采样率问题,如果你的文件的采样率是44 100Hz,而你播放时选择不是44 100Hz,那么播放出来的声音将会严重失真,音调和节拍都会发生变化。如果播放时的采样率高于文件的采样率,那么声音音调将比原来高,但节拍变快;播放时的采样率低于文件的采样率,那么声音音调将比原来低,但节拍变慢。只要播放时的采样率和文件的采样率一致,那么,声音的音调和节拍就不会改变,当然,采样率越低,音质越差。一般的MP3或WAV播放器都能根据原来文件的采样率来播放。

比特率是另一种数字音乐压缩的参考指标,表示记录音频数据每秒所需要的平均比特值(比特是电脑中最小的数据单位,指一个0或者1的数),一般使用kbps为单位(全称为kilobits per second,也就是千位/秒)。CD音乐是以每秒1 411kb的速率记录和传输的,这样1分钟的数据就要大约10MB空间;MP3音乐一般为96—320kbps,用128kbps速率制作的MP3文件,1分钟的数据只需不到1MB的存储空间。速率越快,每秒记录的数据就越多,当然记录的音乐信息就越丰富。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈