信息与智能科学导论
上QQ阅读APP看书,第一时间看更新

1.2.9 声音的数字化编码

声音又称音频,除语音、音乐外,还包括各种音响效果等,是一种重要的信息载体。自然界的声音是模拟音频,是随时间连续变化的模拟量。音频信号体现为波形,具有振幅、周期、频率3个重要指标。振幅越大,音量越大;频率越高,音调越高。

计算机中存储的音频为数字音频,它是随时间不连续或离散变化的数字量。图1-20所示为模拟音频转化为数字音频后的不同效果。

图1-20 模拟音频和数字音频

模拟音频进入计算机时必须进行数字化处理,使其转换为数字音频,这一过程称为音频的数字化,它通常包括采样、量化和编码3个过程。音频的采集和数字化所需的硬件设备主要有声卡、话筒等。

(1)采样过程是指每隔一定时间的间隔T对模拟音频信号的振幅取值,其中T称为采样周期,得到的振幅值称为采样值,采样后的数据仍为模拟量。将每1s的采样次数称为采样频率,如22.05kHz、44.1kHz、48kHz,1分钟的44.1kHz的32位音频,需要约44.1×1024×60×32bit=10.34MB的存储空间。不同采样率的音频如图1-21所示。

图1-21 不同采样率的音频

(2)量化过程是指把每一个采样从模拟量转换为二进制的数字量。

(3)编码过程是指将量化后的数字声音信号以二进制形式表示,编码可以用8bit、16bit、24bit表示,称为采样位数。采样的频率越高、采样的位数越高,声音越真实。

例如,44.1kHz的32位音频,每秒可以有44.1×1024(45 158.4)个采样,每个采样能描述232(4 294 967 296)种声音信号。

如图1-21所示,高采样率的音频文件大小要明显大于低采样率的音频文件大小,但其音频质量要好于低采样率的文件。