1.1 立体声基本原理
自然界中的声源都是呈立体形式分布的,它们从四面八方传入人耳,使人耳能感觉到各种声源的方位、大小、层次、音调及音色,这样的声音就是立体声。为了了解立体声的基本原理,这里先从声音的三要素入手。
1.1.1 声音的三要素
描述声音特性的物理量有三个,即音量、音调及音色,常将它们称为声音的三要素。
1. 音量
音量又称响度,是指声音的大小,是人耳对声音强弱的主观感受。音量的大小由声波振幅(A)的大小来决定,如图1-1所示。声音的振幅越大,音量也就越大;振幅越小,音量也就越小。
图1-1 音量与振幅的关系
2. 音调
音调又有音高之称,是人耳对声音调子高低的主观感受。人们通常所说的声音比较尖或声音比较低沉,指的就是音调。音调越高,听起来就越尖;音调越低,听起来就越低沉。音调的高低由声音的基波频率来决定,频率越高,音调也就越高;频率越低,音调也就越低,如图1-2所示。
图1-2 音调与频率的关系
3. 音色
音色是指人耳对声音特色的主观感受。自然界中单一频率的声波几乎没有,几乎所有的声波除了包含基波外,还含有许多高次谐波,它们共同构成声音的频谱。音色是否丰富,主要取决于声音的频谱结构。一个单一频率的声音其音色往往也单一;一个含有丰富的高次谐波的声音,其音色也丰富,如图1-3所示。
图1-3 音色与高次谐波的关系
由于各种发声体的材料和结构不同,即使它们发出相同音调,相同响度的声音,人耳也能听出它们之间的差别,这就是由于音色不同的缘故。研究发现,相同音调的声音,基频(基波频率)是相同的,如果所发出声音的谐波次数和幅度不同,频谱结构就会不同,音色也就不同。
音色由声音波形的谐波频谱和包络决定,其基波所产生的听得最清楚的声音称为基音,各次谐波所产生的声音称为泛音。单一频率的声音称为纯音,具有谐波的声音称为复音。自然界中几乎没有纯音,所有的声音均为复音。也就是说,每个基音上都附有不同频率和不同响度的泛音,这样,即使两个声音具有相同响度和音调,但由于泛音的区别,人耳也很容易将它们区分开来。声音波形中各次谐波的比例和幅度决定了各种声源的音色特征,其包络(即每个周期波峰间的连线)的陡缓影响声音强度的瞬态特性。声音高保真的目标就是要尽可能准确地传输、还原原始音场的一切特征,使人们真实地感受到如声源定位感、层次感、厚度感等各种临场听感的立体声效果。
音色是一个主观量,无法进行量化,但它与频谱的关系很密切,与声音的瞬态情况(如发声体振动的起振、稳定和衰减时间过程)有关,通常用一些术语来表示,例如,柔和,刺耳,低沉,力度不足等。
1.1.2 人耳的听觉特性
1. 听觉频率范围
通常将正常人所能听到的声音称为可闻声,其频率范围为20Hz~20kHz,故将这一频率范围称为音频。20Hz以下称为次声,20kHz以上称为超声。
实验表明,绝大多数人的听觉范围达不到20Hz~20kHz,而只有少数人能达到,人们通常所说的发烧友就属于这少数人当中的一分子。发烧友之所以能成为音响玩家,是因为他们具有很好的听觉特性,很容易辨别出声音的优劣。音响生产商要想满足发烧友的要求,就得生产出发烧级音响。
在音频范围内,人耳听觉最敏感的区域是1~4kHz中频段,人耳对低频段和高频段的声音则比较迟钝。
2. 听觉阈值
虽然可闻声能被人耳听到,但也并非任何情况下都能听到。例如,当音箱发出一定音量的声音时,某人在相隔一定距离的地方恰好能听到,若再远一点,就听不到了。这说明人耳的听觉有一个最低值,当声压小于这个最低值时,人耳就感觉不到了,这个最低的声压值就称为听觉阈值,听觉阈值和声音的频率有关。不同性别的人、不同年龄的人其听觉阈值也不完全相同,一般来说,在良好的听音环境中,听力正常的青年人,在800~5kHz频率范围内的听觉阈值十分接近0dB(声压值为0.00002P)。正常人能听到的声音强度范围为0~140dB。
3. 听觉等响特性
描述响度、声压级和声源频率之间的关系曲线称为等响度曲线,如图1-4所示。其基本规律是每条曲线上所代表的与声压级、频率相对应的声音,人耳听来都有同样的响度。例如,将1kHz时以dB表示的声压级定义为响度级,单位为phon(方)。可以看出,高于或低于1kHz声音的响度级与声压级就有了偏差。
图1-4 人耳听觉等响特性曲线
0方(phon)以下的声音,人耳是听不见的,所以该曲线可称为可闻阈;120phon以上的声音会使人耳感到疼痛,该曲线可称为痛阈。
100Hz的声音,必须具有40dB声压级,人耳才能听到,而1kHz声音大于0dB声压级,人耳就能听到。因此,当改变一个放音装置的音量时,声音信号中各频率的响度就会改变,使听音者会感到音色的变化。即使是一个高级的放音装置,在低声压级音量时,也会感到放音频带变窄,声音变弱。所以,调音人员在使用调音台调整声音的过程中,作为标准的监听,其声压级应在80~90dB之间。由曲线可以看出声压级在80~90dB时,不同频率引起的响度不平衡差别相对减少,声音的主观听觉偏差较小,这样就能使声音的频率特性调整得比较正确,能让人听到频响平直的声音。
等响特性曲线反映了两个基本规律:一是人耳对3~4kHz频率范围内的声音响度感觉最灵敏;二是声压级越高,等响曲线越趋于平坦,声压级不同,等响曲线有较大差异,特别是在低频段。所以在家庭听音乐时,如果音量不是很高,往往需要利用均衡电路把低频率这一段的音量提高,才会得到好的音响效果,这就是所谓的等响度控制技术。
4. 听觉掩蔽特性
在安静的环境中人耳能够分辨出轻弱的声音,但在嘈杂的环境中,轻弱的声音就会被嘈杂的声音掩蔽而不能听到。在聆听一个声音时,被另一个较强声音的掩盖而致使听不到该声音的现象称为掩蔽效应,其基本类型有以下两种。
1)频域掩蔽
频域掩蔽是指掩蔽声与被掩蔽声同时作用的掩蔽效应,又称同时掩蔽,掩蔽声在掩蔽效应发生期间一直起作用。通常,频域中的强音会掩蔽与之同时发声的弱音,弱音频率离强音频率越近,越容易被掩蔽;反之,离强音频率较远的弱音,不容易被掩蔽。例如,一个1kHz的声音比另一个900Hz的声音高18dB,后者便很容易被前者掩蔽;如果1kHz的声音比频率离它较远的另一个1.8kHz的声音高18dB,则这两个声音将同时被人耳听到;若要使1.8kHz的声音听不到,则1kHz的声音要比1.8kHz的声音高45dB才行。一般来说,低频率的声音容易掩蔽高频率的声音。
2)时域掩蔽
时域掩蔽是指掩蔽声与被掩蔽声不同时出现时的掩蔽效应,又称异时掩蔽。
人耳有一种在时间上称为暂态掩蔽的特性,即人耳对声音强弱的敏感度受到过去声音强弱的影响,称为前向掩蔽;又受到后来声音强弱的影响,称为后向掩蔽。前向掩蔽持续时间为50~100ms,比后向掩蔽持续时间(3~20ms)长得多。时域掩蔽特性如图1-5所示。产生时域掩蔽的原因是人的大脑处理信息需要花费一定时间,随着时间的推移,它很快会衰减,是一种弱掩蔽效应。
图1-5 时域掩蔽特性
3)掩蔽规律
掩蔽效应遵循的基本规律是: 低频声音可以掩蔽高频声音,高频声音较难掩蔽低频声音;提高掩蔽声的声压级,掩蔽的范围将扩大;被掩蔽声的频率越接近掩蔽声,则掩蔽效应越明显。
布置声舞台时,要充分考虑掩蔽效应。在管弦乐队中安置数量较多的小提琴,可增大小提琴的声压级,并将话筒设置在合适的位置上,才不至于使小提琴声被打击乐或发音强的铜管乐所掩盖;在使用调音台合成男女二重唱时,需提高女声通道的输出音量,方能使女声在合唱中不被中低音频率的男声所掩盖。
1.1.3 立体声基本知识
在音响系统中,要想再现立体声,就必须再现出各种声源的方位、大小、层次、音调及音色。显然,若采用单声道来传送音频信号就无法实现立体声的再现,所以必须采用两个以上的声道才行。而且声道越多,立体声效果就越强。
1. 立体声的特点
立体声具有以下两个基本特点:
一是立体声具有明显的方位感和层次感。用单声道放音时,即使声源是一个乐队的演奏,聆听者仍会明显地感到声音是从扬声器一个点发出的。而用多声道重放立体声时,聆听者会明显感到声源分布在一个宽广的范围,就好像自己眼前真的有一支乐队在演奏一样,而且还能清晰地感觉出各种乐器的方位感及层次感。虽然这些都是主观感觉,但它重现了实际声源的相对空间位置,逼真地模仿了实际的声舞台,使人有一种身临其境的感觉。
二是立体声具有较高的清晰度。用单声道放音时,由于辨别不出各声音的方位,各个不同声源的声音混在一起,受掩蔽效应的影响,使听音清晰度降低。而用立体声系统放音,聆听者明显感到各个不同声源来自不同方位,各声源之间的掩蔽效应相对减弱,因而具有较高的清晰度。
2. 声音的传播途径
声音以声波的形式向周围传播,其传播途径有三种,如图1-6所示。
图1-6 声音传播途径
第一种为直达声。是指从声源直接传播到人耳的声音。同一声音到达双耳所形成的声级差和时间差对判断声源的方位起着决定性作用。
第二种为反射声。是指声音从声源发出后,经过室内的表面一次反射后,到达人耳的声音。反射声一般比直达声晚十几毫秒至几十毫秒到达人耳。反射声能给人空间感,可以使人感觉到音乐厅的空间大小。
第三种为混响声。是指声音在室内经过各个边界面和障碍物多次无规则的反射后,形成漫无方向、弥漫整个空间的声音。混响时间的长短决定于音乐厅的几何形状及各界面吸音特性。混响时间对音质和清晰度有着重要的影响,它能给人空间环绕感。
人耳对声源的距离感,在室外根据声音强弱的对比及周围的物体和地面对声音的反射情况来判断;在室内主要依靠直达声、反射声、混响声在时间上、强度上的差异等因素来判断。声源在房间中发声时,直达声、反射声、混响声依次传到人耳,当房间大小形状固定后,反射声强度是稳定的,但直达声强度随声源距离而变化。当声源距听音者较近时,直达声较强,直达声与反射声比值较大,清晰度较高。当声源距听音者较远时,直达声减弱,直达声与反射声比值变小,清晰度降低。所以在室内人耳根据直达声与反射声的强度比及清晰度来判断声源的远近。
3. 人耳对立体声的定位机理
自然界中声源的分布是立体的,人类具有感受声音立体特性的天生本能。虽然目前尚未了解人类这种本能的全部机理,但初步认定人耳对立体声的定位是依赖双耳效应与耳壳效应来实现的。
图1-7 双耳效应
1)双耳效应与耳壳效应
(1)双耳效应
双耳效应指人类利用自己双耳来判别声音方位的能力。人的双耳位于头部的两侧,假如声源不在听音者的正前方而是偏向一边,即声源从图1-7中A点移到B点。此时声音到达两耳的距离就不相等,时间和相位也有差异。同时,由于头部的遮蔽效应,还会使两耳所感受的声音强度也有差别,即声级差。这些差异经听觉中枢神经进行综合判断后,便能确定出声音方位,故称为双耳效应。
当声波频率较低时(700Hz以下),由于其波长较长,因此声波能绕过人的头部而到达被遮蔽的那只耳朵,使低频声波到达两耳的声级差和时间差极小,故低音主要依靠相位差来定位。
当频率较高时(大于2kHz),由于其波长较短,声波不能绕过头部,所以到达被遮蔽的那只耳朵的声级也就比另一只耳朵的声级低得多,故高音主要依靠声级差来定位。
当频率位于700Hz~2kHz范围内时,相位差和声级差的作用同样明显,故这段频率内的声音(即中音)主要依靠相位差和声级差的共同作用来定位。
(2)耳壳效应
耳壳效应指人类依靠自己耳壳的形状特点来辅助判断声源方位的能力。当声源的声波传送到人耳时,由于人耳的形状特点,会使不同频率的声波产生不同的反射,经反射后进入耳道的反射声与直达声之间就产生了时间差和相位差,时间差一般在几微秒到几十微秒之间,这对双耳判断声源也起着一定的辅助作用,故称耳壳效应。
2)声像定位
在欣赏立体声时,人们能主观上想像出各种乐器所在的位置,产生了对现场声源的一种幻像,这种幻像称为声像,立体声重放系统就是要最大限度地再现各种声像的位置。
为了能实现双声道立体声,通常将两个扬声器分别置于听音人前方的左右两侧并分别送入有一定关系的两个信号作为声源,如图1-8所示。
图1-8 声像定位
下面分以下几种情况来讨论。
(1)当两个声源L、R同时发出频率相同,强度相等的同一声音时,由于即无时间差又无声级差,此时双耳听到的声音完全相同,听音人感到在两扬声器正中间有一虚声源(即声像S),而感觉不到两个扬声器在发声,如图1-8(a)所示。
(2)增大其中一个声源的强度,使其发出的声音响度大于另一个声源,双耳将会产生声级差。此时听音者感到声像位置向响度较大的声源方向移动。例如图1-8(b)中,L声源发声强度增大,声像会由中点向左移,其声像移动范围用α角表示。随着两个声源的强度差增大,α角会增大。当强度差超过15dB时,听音者感受到的声像固定在强度大的声源处。由此可知,虽然两个声源位置固定,但当发声强度不断变化时,声像会在两个声源内移动,形成声音的立体感。
(3)将其中一个声源L后移至L′位置,但保证声音到达听音者位置时的强度不变。此时,两个声源只有时间差(Δt),而无声级差。若Δt<3ms,声像向未延时的声源R方向偏移,偏移量与时间差的大小有关,如图1-8(c)所示;若50ms>Δt>3ms时,声像完全移至未延时的声源上,但仍能感觉出延时声源的存在;若Δt略大于50ms时,两个声源发音的前后明显,感觉到有两个同样内容的声音陆续到达,产生回声效果,声音变得丰满;若Δt>50ms时,会感到前后不同内容的声音重叠,破坏了声音的清晰度,声音变得浑浊不清。
(4)若两个声源发出的声音同时存在声级差和时间差,结果会使声像移动量减小。
1.1.4 声音质量
人们在评价声音时,常根据听觉印象,用特定的词汇形象地表达出自己的意见。由于听觉感受不如视觉感受那样具体、生动,所以形容起来比较困难,有时得借用一些生动的词汇来表示听觉。
1. 声音质量的主观评价
声音的质量虽然可以通过相应设备进行测评,但在生活中,一般不这样做,而只是借用一些词汇来描述。下面不妨举几个例子。
1)清晰——模糊、浑浊
清晰是指语言可懂性高,每个音不拖泥带水,乐队层次分明。其中,乐队层次分明不仅指声像的轮廓,还包括旋律、和声、变调等。反之,当声音层次和声音瞬间特性欠佳时,低音和混响时间过长等,就会带来模糊、浑浊的感觉。
2)丰满——单薄、干瘪
丰满是指声音响度适宜,听感温暖、厚实,具有弹性。信号电平高不一定有丰满的感觉。瞬态响应差、谐波损失多、中低音虚弱、混响声不足、反射声的时间延迟不当等都可能带来单薄、干瘪的感觉。
3)圆润——粗糙
圆润是指优美动听,饱满而有光泽。反之,高音过量,失真明显,厅堂特性欠佳都有可能使声音粗糙。
4)明亮——灰暗
明亮是指高、中音充分,听感清新、活泼。直达声、反射声和混响声交融得当,可增加明亮程度。只重视提升直达声往往会使声音变得灰暗。
5)柔和——尖硬
柔和是指声音温和、不尖、不破、听感舒服、悦耳。如果话筒拾音距离过近,会影响声音的扩散,从而不舒展,声音会变硬变尖。
6)真——假
“真”是指保持原有声音的本色与特点。在调音时将不悦耳的声音抑制,或对声音进行必要的修饰,向悦耳的方向努力,但决不能将原有声音的特点变形,否则声音就会变“假”。高保真音响要求再现出来的声音尽量接近现场声。
7)临场感
临场感是指听音时,就好像声音将人带入了节目演奏现场,让人有身临其境之感。
2. 频谱与音质的关系
在评价声音时,频谱结构在很大程度上决定声音的音质。了解声音频谱与音质的内在关系,有助于对声音的调整和修饰。频谱一般分成高频段(7kHz以上)、中频段(500Hz~7kHz)和低频段(500Hz以下)。各个频段的频谱特性对音质的影响分别如下。
1)高频
声音的高频成分多,表现出声音明亮、清晰、锐利。若高频成分过多,则表现出声音刺耳、有咝咝声、轮廓过分清楚、生硬、缺乏弹性、有弦乐噪声等。
2)中频
声音的中频成分多,表示声音有力、活跃清晰、透亮。而过多的中频,会使声音动态出不来、浑浊,
3)低频
声音的低频成分多,声音有气势、厚实、有力、有温暖感、柔和、圆润、丰满;过多的低频会使声音浑浊、沉闷、有隆隆声。
4)整个音频段
声音在整个音频范围内,各频率成分均匀,总体频响平直,声音就自然、清晰、圆润、透明、悦耳、和谐、有韵味、柔和、清脆。
声音的某些频率成分多,另一些频率成分少,声音就粗糙、刺耳、不协调。整个频响的频带窄,会引起声音单薄,无力、缺乏色彩等。
3. 混响与音质的关系
在声音的录制和重放过程中,经常有意加入一些人工混响,这对声音的音质具有一定的影响。
不同形式的节目对混响的要求各不相同,例如语言节目,需要较小的混响,以保证语言清晰、可懂;对流行音乐,特别是摇滚音乐,需要较强的混响;而对古典音乐,民族音乐,则应少加混响。此外,还与演唱者的特点有关,例如,对于自然嗓子发音的,混响可以强一些;对于发音洪亮的,混响可以弱些。总之,混响太少,声音会显得枯燥、死板、压抑、单薄;混响控制得好,声音干净;混响稍多一些,声音有温暖感、丰满、有气魄、有深度感;如果混响太多,声音就会浑浊、松散、模糊,甚至有回声。
4. 音量与音质的关系
由于在不同音量下声音信号各频率成分的响度关系会改变,从而使听音者感到音色的变化。当音量小时,听音者会感到声音无力、单薄、动态出不来、无光泽;当音量合适时,会感到声音自然、清晰、圆润、柔和、丰满;音量大时,会感到声音丰满、有力、动态感强;当音量过大时,会感到声音生硬,不柔和。