1.2.9 声音的数字化编码_信息与智能科学导论-QQ阅读男生轻小说网

上QQ阅读APP看书，第一时间看更新

1.2.9 声音的数字化编码

声音又称音频，除语音、音乐外，还包括各种音响效果等，是一种重要的信息载体。自然界的声音是模拟音频，是随时间连续变化的模拟量。音频信号体现为波形，具有振幅、周期、频率3个重要指标。振幅越大，音量越大；频率越高，音调越高。

计算机中存储的音频为数字音频，它是随时间不连续或离散变化的数字量。图1-20所示为模拟音频转化为数字音频后的不同效果。

图1-20　模拟音频和数字音频

模拟音频进入计算机时必须进行数字化处理，使其转换为数字音频，这一过程称为音频的数字化，它通常包括采样、量化和编码3个过程。音频的采集和数字化所需的硬件设备主要有声卡、话筒等。

（1）采样过程是指每隔一定时间的间隔T对模拟音频信号的振幅取值，其中T称为采样周期，得到的振幅值称为采样值，采样后的数据仍为模拟量。将每1s的采样次数称为采样频率，如22.05kHz、44.1kHz、48kHz，1分钟的44.1kHz的32位音频，需要约44.1×1024×60×32bit=10.34MB的存储空间。不同采样率的音频如图1-21所示。

图1-21　不同采样率的音频

（2）量化过程是指把每一个采样从模拟量转换为二进制的数字量。

（3）编码过程是指将量化后的数字声音信号以二进制形式表示，编码可以用8bit、16bit、24bit表示，称为采样位数。采样的频率越高、采样的位数越高，声音越真实。

例如，44.1kHz的32位音频，每秒可以有44.1×1024（45 158.4）个采样，每个采样能描述2³²（4 294 967 296）种声音信号。

如图1-21所示，高采样率的音频文件大小要明显大于低采样率的音频文件大小，但其音频质量要好于低采样率的文件。