首页 百科知识 音频的输入与输出

音频的输入与输出

时间:2022-10-24 百科知识 版权反馈
【摘要】:图5.11描述了音频信号数字化的过程。相邻两次采样的时间间隔称为“采样周期”。因此,电话语音的信号频率约为3.4kHz,采样频率就选为8kHz。采样的结果就是声音的数字化信息,又称“声音样本”。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65 536的范围里,那么它的精度就是输入信号的1/65 536。麦克风的作用是将声波转换为电信号,声卡将电信号数字化。

5.4.1 音频的输入与输出

代表声音的模拟信号是连续模拟正弦波,不能由计算机直接处理,必须将其数字化。计算机输出的声音也需要还原成模拟信号。

1)声音信号的数字化

声音进入计算机的第一步就是数字化,数字化实际上就是采样、量化和编码的过程(称为“数模转换”)。图5.11描述了音频信号数字化的过程。声音的质量与频域和音色有关,影响数字音频的因素有:采样频率与量化精度(数据位数)。频率越低,数据位数越少,音质越差。录制声音时,音频信号幅度与噪声幅度的比值(信噪比)越大越好。

img98

图5.11 音频信号数字化过程

(1)采样:采样过程就是按规则的时间间隔采集一段时间内的声音模拟信号,即获得采样时刻模拟信号幅度值。相邻两次采样的时间间隔称为“采样周期”。采样频率是采样周期的倒数。采样频率的高低是根据Nyquist理论而定:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做“无损数字化”。因此,电话语音的信号频率约为3.4kHz,采样频率就选为8kHz。通常采样频率越高,对于原声音曲线的模拟就越精确。采样的结果就是声音的数字化信息,又称“声音样本”。

声音通道数指一次采样的声音波形数。单声道一次采样一个声音波形,双声道(立体声)一次采样两个声音波形。采用立体声道的声音更丰富,但存储空间要多占用一倍,多声道的数据量更大。

(2)量化:量化精度是用每个声音样本的存储位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65 536的范围里,那么它的精度就是输入信号的1/65 536。样本位数的大小会影响声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间也越少。

声音经过采样和量化后得到的声音数据所需要的存储容量按照下列公式计算:

存储容量(字节)=采样频率×量化精度/8×声道数×时间。

例如,一段持续1min的双声道声音,若采样频率为44.1kHz,量化精度为16位,不考虑数据压缩,数字化后所需要的存储容量为:

44.1×1000×16/8×2×60=10.584(MB)。

(3)编码:为了方便数据的传输和存储,数字音频的编码必须具有压缩声音数据的能力。最常采用的音频压缩方法是自适应脉冲编码调制法(ADPCM)。ADPCM压缩编码具有信噪比高,数据压缩倍率可达2~5倍,却不会明显失真的特点。

(4)声音输入设备:声音的输入主要通过麦克风和声卡。麦克风的作用是将声波转换为电信号,声卡将电信号数字化。

2)声音信号的输出

计算机输出声音的过程称为声音的播放,通常分两步。首先把声音从数字形式转换成模拟信号(声音的重建),再将重建的模拟声音经过处理和放大送到扬声器或音箱输出。

声音的重建是声音信号数字化的逆过程,也分为三步,如图5.12所示。

(1)解码:将压缩的数字音频恢复为压缩编码前的状态。

(2)数模转换:将数字声音样本转换为模拟信号样本(称为数模转换)。

(3)插值:把时间离散的一组样本转换成在连续时间内的模拟信号。

img99

图5.12 声音信号重建过程

3)声卡的功能

声卡通常分为三类:非专业声卡、专业声卡和商用声卡。声卡主要功能包括波形声音的获取和数字化,声音的重建与播放,MIDI声音的输入、合成和播放。声卡硬件结构如图5.13所示。

img100

图5.13 声卡的硬件结构

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈