3.2 音频采集、记录、还音设备及其特性
3.2.1 设备普遍特性参数
1.动态范围及动态余量
动态范围是用来描述某一段音频或者某一台设备能够处理的最大信号与最小信号的差值。其中,最大信号值是指设备的失真允许值,即信号在失真前的最大值;最小信号值是指设备在静态时的本底噪声值。
通常,一台音频设备或包括采集、记录、处理及还音在内的一套音频系统中,动态范围决定着它能够通过的最大音量的信号与最小音量的信号的范围。比如,动态范围下限越低,越能够录到小音量的声音,例如针落地的声音;上限越高,越能录到大音量的声音,比如原子弹爆炸的声音。如果只有一只话筒,不能调节输入增益,需要在同一个系统不停机地录制“针掉在地上紧接着原子弹爆炸”的声音,假设这套系统的动态范围能覆盖这两个声音的响度,那么就能够比较完美地录制下来;如果这套系统的动态范围不能够覆盖这两个声音的响度,那么结果要么就是听不到针掉地上的声音,要么就是原子弹爆炸的声音会破掉。当然这只是个假设,事实上会有很多办法来录制这两种声音然后在后期进行合成。
动态余量是指正常信号电平与失真电平之间用分贝来表示的电平差。与动态范围类似,动态余量越大,则通过设备或系统的不失真信号电平越高。如果设备或系统拥有充裕的动态余量,那么其能通过高峰值电平的信号,而不只将信号削波。这对与类似“打火机声音”这样典型的拥有高峰值低响度的音频信号的声音尤其有用。
动态余量与动态范围不同之处在于,动态范围是指系统的静态时本底噪声值与失真允许值之间的空间范围,而动态余量是指信号与失真允许值之间的空间范围。动态范围是某个设备或某套系统固有的参数,而动态余量是可以根据经验或协定而随时更改的。
2.频率响应
频率响应用来描述某一设备对相同能量的音频信号在不同频率上的不同灵敏度。很多设备说明书上会用一副“频率响应图”来描述设备的频率响应特性。
3.信噪比
信噪比是指信号与噪声的比例。信噪比越大,得到的信号质量越好。在录音中应该尽量得到高信噪比的信号。通过话筒离声源更近的方式,可以得到更好的信噪比。
【实例分析3-5:如何提高信噪比】
在影视同期录音的过程中,常常会处在比较嘈杂的环境中。所以,如果想要把台词录清晰,就需要提高信噪比。在设备、环境等硬件条件无法改变的前提下,通过“让话筒离声源更近”的方式,可以获得更好的信噪比。根据平方反比定律可以知道,距离每增加一倍,声音的能量就会衰减一半。所以反过来,距离每减少一半,声音的能量就会增加一倍。
比如,现在发生在学校食堂的一场戏。可以认为整个环境噪声在食堂空间的任意位置都是平均而恒定的,所以话筒放在任何位置,拾到的环境声能量都是一致的。但是对于想要的信号来说,话筒离声源越近,能量越大。比如,话筒距离演员的嘴4m的时候,得到的信号与噪声的能量一致,信噪比是1/1;如果把话筒距离缩短1m,变成2m,信号加倍变成2,噪声不变,信噪比是2/1;如果再缩短至1m,信噪比就变成4/1;距离为50cm时,性噪比变为8/1;距离为25cm时,性噪比变为16/1。
所以,只要将话筒里声源更近一点,得到的信噪比就会更好。
4.失真
如果输入的音频信号过高,超过了设备所能承载的电平量,就会出现“削波失真”,会听到类似于“沙砾般的、咔嗒般的”声音,这是因为信号的波峰被削去以后成为平顶形的波形。失真的音频无法再被还原。所以,在录制的时候一定要检测电平量,以免失真。
3.2.2 话筒
1.话筒概述
传声器俗称话筒,是一种将声能转化为电能的换能装置。空气的波动引起话筒振膜的振动,然后振膜带动线圈切割磁感线,将振动转化为电信号通过线缆传导出去。
2.话筒的种类
录音用话筒根据把声音变为电信号的转换方式,可分为常见两大类:动圈式和电容式。它们采用不同类型的振膜,导致录制声音的特性也不一样。
动圈式话筒更加坚固耐用,它的结构使它适合录制大声级的冲击性声音,它的振膜比电容话筒的振膜振动得稍慢,导致它对高频声音不是特别灵敏,动圈式话筒不需要外部供电。
电容话筒更加灵敏也更加脆弱,它的振膜通常不能长时间承受大声级的声音。在可控情况下,电容话筒可以使原始声音得到的更真实、细腻并能延伸至高频,电容话筒在录制中使用最为广泛。电容话筒需要供电,电容话筒的振膜使用所谓的幻象供电,如果没有幻象供电就不能将声信号转化为电信号。一般来说幻象供电为48V,一些话筒要求较低为12V。在使用幻象供电前,需参考话筒的使用手册,以免损坏话筒。
话筒的指向性类型:话筒的指向性是指声音入射角与灵敏度的关系的特性,其分类如图3-3所示。
全指向:又称无指向性。这种类型可以拾取到来自话筒周围360°的声音。同一距离下,越靠近话筒指向性最强,灵敏度最高的地方,拾取的声音越清晰、结实。
心形指向性:又称单指向性。这是一种心形的指向类型,主要拾取来自话筒前方的声音,同时排除了部分来自侧面和所有来自话筒后面的声音。
8字形指向性:又称双指向性。这是一个双重的心形指向,可以拾取来自话筒两侧的声音。
超心形指向性:这是更加集中的心形,排除了更多来自话筒侧面的声音和所有来自后面的声音。
■图3-3 话筒的指向性
【实例分析3-6:Boom Library Assault Weapons枪声实录使用话筒分析】
在录音棚中,最常见的人声录制的话筒是NEUMANN U87。U87的话筒指向性是在全指向性、心形指向性和8字形指向性中可调的。在不同的应用条件下会使用不同的指向性模式。通常使用心形指向性来录制人声独唱。全指向性会录到更多空间的声音。8字形指向性可以用在两个人的拾音上。
在外景录音中,通常会使用超心形指向性,典型的超心形指向性是Sennheiser MKH-416,也称之为枪式话筒。需要注意的是,枪式话筒的指向角是非常小的,如果话筒的轴向不能比较好地指向声源,就会发生离轴,声音会变得闷、不清晰。
2014年Boom Library公司出品的ASSAULT WEAPONS SFX Library(突击步枪音效库)使用了60多只话筒来对25种武器进行录制,包括直接粘附在枪手和武器上的和设置在枪手周围的各种话筒。ASSAULT WEAPONS CONSTRUCTION KIT精选了18轨录音信号来进行制作。下面是武器和18轨录音信号的话筒详细设置,包括话筒类型和摆放距离。
18路话筒详细设置如下(见图3-4):
DPA 4062,全指向型微型话筒,粘附在武器上;
2x Sennheiser MKH 416,用途广泛的枪式话筒,放置在前方离枪手1m处,双单声道;
2x Heil P30,心形指向动圈话筒,放置在前方离枪手3m处,AB制;
2x Sennheiser MKH 8040,心形指向电容话筒,放置在前方离枪手4m处,AB制;
2x Microtech Gefell M300,心形指向微型电容话筒,放置在前方离枪手4m处,大AB制;
2x Schoeps CCM,心形指向微型电容话筒,放置在右后方离枪手12m处,MS制;
2x Neumann RSM 191,立体声话筒套装,放置在左前方离枪手15m处,MS制;
Sennheiser MKH 416,放置在后方离枪手15m处,单声道;
2x Sennheiser MKH 418,立体声话筒套装,放置在后方离枪手50m处,MS制;
2x AKG C414,AKG著名多指向性电容话筒,放置在后方离枪手100m处,MS制;
这些不同型号、距离以及不同方向的话筒,就是在利用不同的话筒的特性来录制不同的音色部分。比如全指向型DPA 4062话筒,黏附在武器上,可以得到最近最实的武器机械结构的声音;sennheiser418放置在后方提枪手50m处,得到更多回声;等等。在后期中还要再次将其进行混音。
■图3-4 话筒具体位置
3.话筒的其他参数
(1)频率响应
频率响应是指话筒能够再现的最高和最低的声音频率。每只话筒因为使用的材料和形状的差异以及其他因素导致其对于声音频率的响应不同。根据经验,话筒能够接收声音的频谱越宽,再现的声音就越精确。
(2)阻抗
话筒阻抗是指话筒在1kHz时的有效输出电阻。阻抗在150~600Ω之间的话筒为低阻话筒;1000~4000Ω之间的话筒为中阻话筒;高于25kΩ以上的话筒为高阻话筒。通常使用的是低阻话筒这样可以用较长的话筒线而不致拾取交流声或是失真高频成分。
(3)最大声压级
声压级(SPL)是一种对声音强度的计量。如果话筒的最大声压级指标为125dBSPL,那么当乐器发出125dBSPL的声音到达话筒上时,话筒将出现失真。通常认为话筒的最大声压级指标为120dBSPL时属良好,135dBSPL时为很好,而150dBSPL时则为极好。动圈话筒不易失真,一些电容话筒可以勉强达到较好的指标。为了防止在话筒电路内失真,有些话筒设有音量衰减开关。
(4)灵敏度
话筒的灵敏度指标是指在一定声压级下所能产生多少输出电压。两支话筒处于同等大小的音量下时,高灵敏度的话筒要比低灵敏度的话筒输出更强的信号。
(5)本底噪声
本底噪声也叫等效噪声电平,是话筒本身产生的电噪声或咝咝声,噪声产生的输出电压与信号源产生的输出电压甚至可以相等。由于动圈话筒没有有源的电子部件来产生噪声,所以它与电容话筒相比具有很低的本底噪声。因此,大多数动圈话筒的指标一览中没有本底噪声指标。
4.常用话筒的型号与应用
(1)立体声话筒
立体声话筒使用的立体声拾音技术主要有三种:两只话筒间隔摆放、XY制和MS制。间隔摆放技术是使两只话筒相隔一定距离,立体声的感觉来自两只话筒形成的时间差和强度差。XY制拾音技术是将两支话筒以一定角度对置这个角度在90°~135°之间,这是一种最基础,使用最广泛的立体声拾音技术。MS制立体声录音技术更先进、更复杂,这种制式使用一支心形话筒直接指向声源从而提供了M声道,此外还有一支8字形指向的话筒与中间话筒垂直放置来提供S声道。一个矩阵解码器被用来使两个声道(M+S/M-S)的声音产生立体的效果。
(2)枪式话筒
枪式话筒专门为拾取来自话筒前方的声音而设计,并对来自话筒两侧和后方声音有屏蔽作用。电影或电视里大部分对话都是用枪式话筒拾取的(也被称作吊杆式话筒)
例如,Sennheiser MKH-416是电影电视制作领域枪式话筒的行业标准。这种话筒可以完美地录制单声道音效,它的拾音类型使它可以很大程度上摒除来自话筒两侧和后面的噪声。
话筒类型:电容;
频率响应:40~20kHz;
话筒指向类型:超心形;
话筒极头:小振膜;
最大声压级:130dB;
幻象供电:48V。
(3)人声话筒
这些话筒是为了录制人声而设计的,特点是配备有大振膜,它们为近距离拾音的人声提供了平滑、平衡的音质。
例如,Shure SM58这款话筒是在录音棚、演出现场录制人声的行业标准。尽管在声音设计工作中它不被推荐使用,但是它可以录制用于需要通过滤波器处理从而模仿对讲机和民用收音机的人声。
话筒类型:动圈;
频率响应:50~15kHz;
话筒指向类型:心形;
话筒极头:小振膜;
最大声压级:小于180dB;
幻象供电:无。
(4)领夹式话筒
领夹式话筒可以暴露或隐藏起来。通常这种话筒使用无线系统,但是可以通过电缆连接到调音台。
例如,tramTR-50是电影和电视剧制作中领夹式话筒的行业标准。它的频率响应在8kHz有所提升,用以补偿话筒隐藏在衣物和戏服下所带来的音色损失,其拾音类型使得它也可以被固定在话筒架上或车内使用。
话筒类型:电容;
频率响应:40~16kHz;
话筒指向类型:全指向;
话筒极头:领夹式;
最大声压级:134dB;
幻象供电:12V内置\48V。
3.2.3 调音台
录音棚的心脏就是调音台。它是接入所有信号端口的控制中心;它们可以混合或组合;可加入效果、均衡和进行立体声声像定位;然后把信号分配到录音机和监听音箱上去。
1.调音台的分类
现在使用的调音台多种多样,虽然它们的基本功能大致相同,但根据用途及所采用的技术的不同,他们之间存在着一定差异,从而出现多种类型调音台。
由于分类标准的不同,通常采用下列几种分类方式:
①按节目种类可分为音乐调音台和语言调音台。
②按使用情况可分为便携式调音台和固定式调音台。
③按输出方式可分为单声道、双声道立体声、四声道立体声及多声道调音台。
④按信号处理方式可分为模拟式调音台和数字式调音台。
除此之外还有另一种特殊的调音台:软件调音台(虚拟调音台),这是一种只能在计算机显示屏上见到的仿真调音台。
2.调音台的基本功能
(1)放大
将微弱的低电平传声器信号和高电平线路输入信号经放大调整到合适的电平上、将容易互相干扰的信号隔离开来以免互相串扰、补偿由于分配开关及衰减网络带来的损耗、给提示耳机外接声处理设备及对讲系统提供合适的电平信号。
(2)为每个通道设置可控均衡器
补偿输入信号的缺陷,获得某种特殊的效果,对于不需要的信号进行有选择的衰减,信号重放时提供最大限度的保真。
(3)通道或母线分配
它是提供用以使任一输入信号任意分配到指定的输出母线上的开关设施。
(4)声音监听
它是用来对每一声道上的信号进行音质主观评价的手段,根据需要设置监听机组和音箱。
(5)视觉监视
它是调音师对视觉信号进行客观评价的手段,一般是通过VU表、峰值表和相关仪表来完成对信号的音量、峰值电平和信号间相互相位的监视。此外还设置了一些简单的指示器来完成对信号状态及通路控制状态的指示。在大型自动化的调音台中,一般配有电视监视器来对以上所提的参量进行显示。
(6)电平调节
每个声道上的电平调节器可以对声道上的信号电平进行连续调整,以便能够在混合输出母线上建立一个相对平衡的信号。
(7)提供测试信号
主要进行各种测试和故障检查,如在录音之前检查各个声道,检查每个声道的频响。
(8)跳线功能
调音台上的电气关键接点都通过连接件接到跳线板上,跳线盘是各种关键接点的集合。跳线盘的插孔可以将常用的设备接入通路中,如接入测试仪器、在不断开调音台的内部连接的情况下,将周边设备接入通路中、通过将插头插入,可以将信号“跳入跳出”,增加了调音台的灵活性和功能。
3.2.4 音频信号处理器
1.均衡器
在多声道录音中使用最多的信号处理设备之一就是频率均衡器,所谓均衡指的是某一频段上信号的声能与其他频段上的信号声能相比发生了相对的变化,而这种相对变化的大小就称之为均衡量。均衡(EQ)可以改善真实性,可以使迟钝的鼓声变得清脆,使软弱无力的电吉他变得犀利,EQ也能使某一声轨的声音变得更自然。为理解EQ的工作情况,需要了解频谱的概念,每一种乐器的声音或人声都会产生很宽广的频率成分,称之为频谱,它们中有基波频率和谐波成分。如果提升或衰减频谱中的某些频率成分,就会改变所录得声音的音质,升高或降低某段频率范围的电平,可以调节声音的低音、高音和中音,也就是改变了频率响应,从而导致人耳对声音频谱结构的听觉感受——音色发生了改变。这便是通过均衡器改变音色的基本原理。
2.压缩器
压缩器是常用的振幅处理设备,压缩器处理的对象是声频信号的动态范围。声源的动态范围指的是在某一指定时间内,声源产生的最大声压级(SPLmax)与最小声压级(SPLmin)之差。表达式为动态范围(DR)=(SPLmax-SPLmin)。压缩器对信号的动态范围进行压缩处理,使信号能满足记录和发送设备对动态范围的要求。因为设备的动态范围是指其最大不失真电平与其固有的噪声电平之差,所以在记录或发送动态范围很大的声源时,为了避免高电平信号所引起的失真和低电平信号所出现的信噪比下降,就必须对信号的动态范围进行压缩。
从某种意义上讲,压缩器是一个单位增益的自动电平控制器。当压缩器检测电路要处理的信号超过预定的电平值之后,压缩器增益就下降,即增益值小于1,下降的幅度取决于压缩器的压缩比率设定值;反之,当检测的信号低于预定的电平值,增益将恢复到单位增益或保持单位增益不变。所以,压缩器的增益值将随着信号的电平变化而变化,这种增益变化的速度是由压缩器的两个参量,即建立时间和恢复时间决定的。
(1)压缩比(ratio)
压缩比是输入信号分贝数与输出信号分贝数之比,其大小决定了对输入信号的压缩程度,如果它为1∶1时,对信号没有进行任何压缩;当压缩比为4∶1时,则每增加4dB的输入信号,输出信号才增加1dB。太大的压缩比率则会对信号过度压缩,使动态损失过大。过分的压缩会导致声音非常窄,且听起来不自然,还会产生噪声。在扩声系统中,如果作为压缩。
(2)门限(threshold)
决定压缩器在多大输入电平时才起作用的参数。如果输入信号的电平高于门限阈值,那么压控放大器的增益将会明显减小,输入信号的动态范围被压缩;如果输入信号的电平小于门限阈值,那么压缩器不会对输入信号作压缩处理。门限阈值调的过小,会造成输入信号还不是很强时就开始压缩,声音听起来十分压抑,信号动态损失严重;调的过大,则会出现输入信号已经很大仍得不到压缩现象,压缩器起不到作用。
(3)建立时间(attack time)
建立时间是指当输入信号超过阈值后,从不压缩状态进入压缩状态所需要的时间。如果压缩器的启动时间长,输入信号超过阈值后要等一会才进入压缩状态,致使压缩器有可能不能压到音头或能量最强的部分;如果压缩器的启动时间很短,输入信号一达到门限阈值就立即进入压缩状态。
(4)释放时间(release time)
释放时间是当输入信号小于阈值后,从压缩状态恢复到不压缩状态所需的时间。如果压缩器的释放时间过长,输入信号低于阈值后要等一会才恢复到压缩状态。
3.混响器
混响效果是把房间声响、环境或空间等的感觉加入乐器声和人声之中。要了解混响的工作原理,就应该明白混响在房间内是如何产生的。在一间房间内的自然混响是一连串复杂的声反射的结果,这些反射声使原声保持一些时间后渐渐消失或衰减。这些反射声能使人感知到是在大型的或是在具有硬表面的室内发出的声音。已有的人工模拟混响装置有4种,分别为声学混响室、板混响器、弹簧混响器及数字式混响器。随着数字信号处理技术在声频领域中的广泛应用,目前在演播室中采用的混响器基本上都是数字电子混响器。
(1)混响器的作用
利用混响器使声音更加丰满、使声音更具临场感和空间感、塑造声源的空间定位。
(2)混响时间(RT60)
混响时间为混响电平衰减到原始电平60dB之下时所需要用的时间。房间越大、越空旷,混响时间越长;相反房间越小,吸声材料越多,种类越丰富,混响时间越小。
(3)早期反射声(pre-deley)
在发出混响声之前,用一个短暂的延时来模仿在真实房间内混响开始之前的延时。早期反射声的时间越长,房间的声响越大。
3.2.5 录音机
录音机将话筒传送的电信号收集起来,并存储在硬盘或闪存卡等媒介中。这些年来,存储媒介发生了变化,但工作原理大体相似。以下是录音设备简史:留声机、唱机、录音电话机、磁带录音机、CD光盘、数字音频磁带、硬盘录音。
现代录音机:现在市场上大量的便携式现场录音机,“数字”几乎等同于“专业”,事实却并非如此,有的录音设备自诩有很高的采样频率和比特深度,但却配了极差的话筒前置放大器和其他元器件。所以在使用数字便携式现场录音机时需注意。线路电平会比麦克电平大一些,将话筒信号通过独立的信号放大器放大到有用的信号水平是很有必要的,这种放大器称为前置放大器,它由录音机上的增益微调旋钮控制,便携式现场录音机最重要的就是话筒前置放大器的质量。现场录音机是便于携带的与棚内录音机不同,这就意味着它可以经内部电池盒供电。数字录音机提供多种可选采样频率和比特深度。一台双轨录音机可以同时录制两个声道的音频信号。不要认为两个声轨就是左声道和右声道,它们是两个没有关联的通道。可以录制两轨以上声音的录音机称为多轨录音机。
便携式录音机:罗兰R-26内置两种类型的立体声话筒,外加一对XLR/TRS两用输入接口用来连接外接话筒,以及一个用于连接供电话筒的输入口,可以同时使用内置话筒(指向性和全向性)与外接话筒。内置全向性和指向性两种立体声话筒,带48V幻象供电的XLR/TRS两用输入接口,外加一个立体声供电话筒输入接口,支持6通道同时录音(3个立体声通道),大尺寸LCD触摸显示屏带来直观的导航;带有用于微调的输入电平旋钮;内置高速USB接口,可用作音频接口或外接存储设备。
3.2.6 还音设备
还音设备指的是监听耳机与监听音箱。
1.监听音箱
监听音箱指专门设计的具有平坦频响的专业音响。通常扬声器是指家用级音箱,虽然家用级回放起来的声音听起来不错,但并不适用专业音频制作,专用监听音箱与家用音响的区别在于精确度,回放声音的精确度至关重要。例如,家用级音箱会在低频段上有所提升,这种低频提升人为地改善了真实声音,如果将这类音箱用于专业领域,很有可能觉得低频需要做适当的均衡处理,但实际上低频根本无须调整。所有的专业监听音箱都具备从20Hz~20kHz,甚至更高的平坦频率响应范围。
监听音箱分为两大类:有源监听音箱和无源监听音箱。有源监听音箱在每个箱体内置有一个用于推动扬声器的功率放大器。在使用有源监听音箱时,需要匹配每个音箱的输出电平以确保回放声音的立体声平衡。这可以通过每个监听箱体背后的旋钮实现。无源监听音箱则没有内置功率放大器,因此需要另配功放。
2.监听耳机
与监听音箱相比,耳机具有如下优点:
①成本相对较低。
②不会受到房间声学的染色。
③在不同环境之下听到的音质是相同的。
④可以方便地进行实况监听。
⑤易于听到在混音时的细小变化。
⑥没有房间反射,瞬态响应更敏捷。
与监听音箱相比耳机也有如下缺点:
①长时间佩戴会感到不舒服。
②廉价耳机有的会音质不准确。
③耳机不能通过身体来体验低音音符。
④由于耳机结构内的压力变化使得低频响应会有变化。
⑤声音出现在头颅里面而不是正前方。
⑥用耳机很难判断立体声的空间分布。
3.2.7 音频接口(包含模拟接口和数字接口)
拥有了大容量的快速计算机之后,就需要一种取得进出计算机的音频信号的方法,音频接口可以承担这一任务。声卡和音频接口是外部信号进入计算机,以及计算机内部信号输出到外围设备的枢纽。
接口主要分为非平衡接口和平衡接口。
1.非平衡接口:二芯接口、莲花接口
二芯接口(TS):二芯分为大二芯和小二芯,插头尖为火线(热端),插头套为地线(冷端)如图3-5所示。
莲花(RAC)接口:RAC接口的名字来源于其发明公司——美国无线电公司。现在这种接口被普遍应用于家用级音频与视频市场。RAC接口只有两个连接端,因此它是非平衡的。接头为热端,套端为接地端,如图3-6所示。
■图3-5 二芯接口
■图3-6 莲花接口
2.平衡接口:三芯接口、卡侬接口
与非平衡接口相比,平衡式的模拟接口由于多了一道屏蔽层,可以有效地减少线路带来的干扰。
三芯接口(TRS):小三芯、大三芯(TRS)外观上与小二芯、大二芯插头十分相似,但是它的结构是尖、环、套(T、R、S),如图3-7所示。
卡侬接口(XLR):卡侬接口主要用来连接话筒。由于自身带有锁定装置,因此卡侬接口在连接上是最为牢固的。卡侬接口有三个针脚,分别是地段(地线)标记为1、热端(火线)标记为2和冷端(零线)标记为3。其中,带针脚的称为“公头”,用于输出信号,带针孔的称为“母头”,用于接受信号,如图3-8所示。
■图3-7 三芯接口
■图3-8 卡侬接口
香蕉插头(banana plug)是普遍装于音箱线两端的供插入香插座的一种插头,如图3-9所示。这种插头的名字来自于它稍稍鼓起的外形。插入上面提到的多用插座正面的孔时非常方便,插入后也可以形成非常大的接触面积。这种特性使得它被优先使用在大功率输出的器材中,用以连接音箱和接收机/放大器。
■图3-9 香蕉插头