在影视录音中,麦克风话筒可以说是非常重要的一环,同期录音网过去也进行了相关的基础介绍,感兴趣可以看文章结尾的链接。影视录音对麦克风的各方面要求都很高,特别从“还原真实”的角度来说,麦克的失真就是非常重要一环,今天就来学习一下麦克的失真。
我们不希望在整个录音过程中每一环节出现任何意外的失真。不幸的是,尽管很多失真低于可听度的阈值,但通常最终的录音难以避免存在某种形式的失真。在设置录音链条时,音频链的各个链路可能各自对都有失真,进而影响到总失真,最终失真可能变得被可听见。
所以在考虑失真量之前,我们必须定义我们在设备中遇到的各种形式的失真 - 在这种情况下 - 本文章特别关注麦克风的失真。我们还必须考虑听觉系统(耳朵和大脑),它自设定了可听性的真正限制。
失真 - 线性还是非线性?
首先定义失真,信号(声音)从输入到输出的整个传递过程,该信号的任何变化(即信号的波形变化)都可视为失真,总的来说,所有失真都是非线性的。按照信号的变化这一定义,一般我们将声音幅度的变化归类为是“线性失真”,因为它可以在稍后阶段进行一定的校正。信号的延迟有时也被认为是线性失真,因为波形是完整的,只是稍后传递。
在这个定义下,任何有意应用的均衡,频响带宽的任何变化和任何声音限制都会导致一种失真。但是,我们更应该认识到有些无意识的失真以及它如何影响感知的音质。
失真 - 它来自哪里?
由于系统中的技术限制和其他非线性的变化而发生失真。
先来看声音传输,即使在空气中,声音也有其“量”的限制。当声压级超过194 dB SPL时,没有更多的空气分子形成声波,因为它达到了完全真空的程度,看下图0Pa以下部分,已经产生了削波。
图1. SPL超过194 dB时的失真。
将这段声音文件导入后期工作站如图:
图2.声音波形文件:Apollo 13升空。
在60秒后,您可以听到严重失真的声音。那就是空气中的失真。如果查看波形(如上图),可以看到0上正部分是高于负部分。
麦克风失真
麦克风的主要拾音基础部件是震膜。如果麦克风是电容拾音类型,则震膜安装在一个背板的前面,两者之间有一定的距离,通常在20-50μm的范围内。
当将麦克风置在高SPL声压级(从听阈到痛阈,声压的绝对值相差1000000倍。显然,用声压的绝对值表示声音的大小是不方便的。为了便于应用,人们便根据人耳对声音强弱变化响应的特性,引出一个对数量来表示声音的大小,这就是声压级,通常单位是分贝dB。)输入情况下时,很明显,至少声波在沿背板方向推动振膜时,膜片的偏移是有限的,所以振膜就产生了失真。而且,震膜材料本身对于在任一方向上“可拉伸”的方式都有限制,一旦超出限制,同样会产生失真。
任何电容式麦克风都需要一个将麦克换能器的高阻抗转换为相对低阻抗的电子级间,以便适配较长的电缆线路。该电子设计可能是非对称的,这会产生失真。(DPA®的CORE麦克是一次成功的改进)。尽管制造商们一直在努力改进麦克风,但麦克风系统存在最终可能导致失真的限制。
图3.描述系统非线性的一种方法。蓝色曲线:没有限制。红色虚线曲线:系统中的限制。
如何量化失真?
根据IEC标准(国际电工委员会简称IEC,是世界上成立最早的非政府性国际电工标准化机构,是联合国经社理事会的甲级咨询组织),非线性幅度由三个度量表示:总谐波失真,Total Harmonic Distortion(THD),N阶失真和二阶差频失真。
让我们看一下这些术语是什么意思?
总谐波失真Total Harmonic Distortion:谐波失真是指输出信号比输入信号多出的谐波成分,而所有附加谐波电平之和称为总谐波失真。
一般测量的方法是,发生一个由一个且仅一个频率的纯正弦波。当失真(典型的是通过削波)发生时,会产生附加频率 - 基音的整数倍。如果将麦克风置与这个纯正弦波(例如1kHz)的声场中,则失真产物 - 产生的谐波 - 包括2kHz,3kHz,4kHz等的频率分量,通常在电平上会下降。(在对称削波的情况下,仅产生不均匀的谐波,第3阶,第5阶,第7阶等)。
THD测量是通过测量所有高次谐波的量(RMS)作为基频电平的百分比来进行的。最好的结果是在动态范围内的部分小与<1%。1%谐波失真意味着不需要的频率分量在基频以下有40分贝。这是许多麦克风制造商的首选的标准。这也是一个“能看到”的指标,因为这种失真量在波形上变得可见,例如在示波器上监视或在DAW工作站中录音和查看时。
图4. THD是由非线性引起的谐波部分,例如削波。
在实践中,THD难以在中低的SPL下测量,因为与麦克风相比,扬声器通常表现出更高的失真。还需指出的是,当接近麦克风最大声压级限制的电平时,THD可能会迅速增加。
n阶失真Distortion of the nth order:原则上与THD相同,只是单独测量和量化谐波。一般在第三次谐波中失真通常是最明显的,通过对称削波来代表所有谐波产生的最高电平的谐波。
差频失真Difference frequency distortion:测量原理为,两个纯正弦波音调应用于相同的电平。IEC标准将频率之间的距离定义为80 Hz。频率的示例是1000Hz和1080Hz。但是,也可以应用更广范围的扫描。差异失真产生和频和差频(即1000Hz和1100Hz产生100Hz的差频)。测量这些频率分量并将其量化为基频的百分比。
必须指出的是,应用标准化方法来量化失真是绝对正确的。但是,这个标准只能考虑到一小部分可能的失真形式。在现实生活中,声音信号要复杂得多,失真也更是如此。
听得见什么?
要找到对于失真重要的东西,我们必须同时对心理声学进行研究。以下是一些影响感知声音的因素。
听力阈值Threshold of hearing:我们的听力系统有一个自然的下限。此限制随频率而变化。在低频率时,阈值水平相当高。在2-4kHz的频率范围内,听觉阈值水平低。见下图。
图5.曲线表示听力阈值(听力正常的人)。人类无法听到低于阈值的声音。请注意,人类不能很好地听到低频。
屏蔽效应Masking:是指当耳朵暴露于特定频率范围内的声能时,会产生对周围频率的屏蔽。这种屏蔽尤其适用于更高的频率。
下图显示了各种SPL下1kHz纯音频的屏蔽曲线。
图6.该图显示了1kHz纯音在各种SPL下的屏蔽曲线。
这意味着,发生的声音失真通常由于屏蔽效应而变得听不见。
图7.即使失真为5%,1 kHz音调的3次谐波(3 kHz)也会因掩蔽而听不见。
对于差频失真,屏蔽频率以下的频率分量变得最可听见。特别在音乐录音中,这与差异音调不一定是音乐本身有关,因此被认为更令人讨厌。
对于所有比特率压缩的音频格式都会产生屏蔽效应。在这种情况下,失真可能很高并且信噪比低。但是,我们(一般听众)经常接受它听起来的方式。
人耳失真Distortion of the ear:人耳本身也会产生失真。这种现象尤其存在于较高的SPL声压级中,耳朵在较低SPL时具有最佳分辨率。
当听到几乎同样响亮的两个音调时会听到这种现象。根据两个音调之间的频率间隔,可以听到第三个音调。例如,如果您听到两个音调间隔为五分之一,C3和G3(131 Hz和196 Hz),您的耳朵将产生65 Hz的差异音调(C2,低于C3的一个八度音程。
以下是互调或差频失真的示例。产生两个音调,然后耳朵产生不同的音调失真。然而,由于屏蔽效应,仅感知真实音调下方的音调。
图8.耳内失真:由于两个频率而产生的频率分量:1 kHz和1.6 kHz。只有低于1 kHz的两个声音组件才能听到。
结论
通常,麦克风应该没有失真。然而,实际上肯定会有一些。而像THD和差频失真测量并不能说明失真的全部情况。但是,这些标准化的指标数字可以被视为设计麦克风“健康”的指标。耳朵感知的东西相当复杂,因为耳朵也会产生失真,尽管有这些数字指标,但麦克风的失真越多,录音中的声音越混杂,越不清晰。