音乐科技杂志

音乐混音中重塑空间纵深感的技术手段

混音技术

混音是音乐制作中的一个重要音频技术环节,对音乐作品的可听性有着重要影响。因此,塑造一个与作品风格特点相适应的空间,是音乐混音尤其是流行音乐混音的首要任务。

1.混音维度构成

混音中的空间由宽度、高度和深度三个维度构成。其中宽度和高度的控制较为直观,深度则相对复杂。因为深度的控制涉及的因素较多,且多数因素对深度的影响既独立又相互关联:

1.当作为一个整体处理时,空间的深度需要以混音工程文件中原始录音的分轨素材之间音量的对比来获得基本的远近关系。

2.作为空间中个体的处理时,素材的深度则由素材本身的频率内容、声音细节以及形体等素材在整体空间中的重要性和价值才能得以展现。

单独审听和调整某个素材的电平,而不将其放到音乐整体中比较,调整则将失去意义。

1.1 根据平方反比定律调整电平

计算、调整素材的电平,除需通过听觉判断外,还需参考声压级与距离之间的计算公式——平方反比定律。此定律在以直达声为主的声场条件下才成立,而通常近距离录制所得的素材与直达声的概念十分相近。因此,距离与声压级的平方反比定律对混音中素材的电平调整具有指导意义。

常用的声压级与距离的关系是:距离增加1倍,声压级下降6 dB。

1.2 使用“纵深区域”的概念

“纵深区域”是混音中用于电平控制的概念,可作为素材电平调整的目标,用于理清素材之间距离的关系。根据素材在音乐织体中的意义和重要性,以不同素材之间音量的对比体现空间的纵深感的前后位置关系,可划分六个纵深区域进行控制:第一区域为0 dB~-4 dB;

第二区域为-4 dB~-12 dB;

第三区域为-12 dB~-20 dB;

第四区域为-20 dB~-32 dB;

第五区域为-32 dB~-48 dB;

第六区域为-48 dB~-∞。

 

注:“纵深区域”的应用主要针对电子音乐和流行音乐的混音,古典音乐类同期录音的后期制作不在论述范围内。

 

“纵深区域”划分的依据:

1.同一素材以不同的音量在相邻纵深区域中(具有相同声像位置)同时回放;

2.声源距离越近,声音的音量越高、动态越大。为了让相邻的、较远的区域中动态较低的声音不被淹没,电平范围以“向下”差值递增的方式划分,使电平的控制更加精准;

3.以领唱、低鼓、军鼓、贝斯、节奏吉他、踩镲(Hi-Hat)等一些重要音乐元素在不同风格中较为常见的纵深摆位作为参考。

 

电平的读值应以峰值表(包括数字PPM)为标准,使用峰值表的原因为:

1.峰值表使用5 ms作为采样时间间隔,能够准确反映瞬态信号的峰值;

2.峰值表读值与听音距离遵循相同的计算方式——对数关系。根据乐曲的风格特点,通过电平推子将瞬态信号峰值活动频繁的区域调整到大致相应的“纵深区域”,再通过听觉作精细调整。

如在嘻哈(POP)风格中,主唱素材最大峰值电平为-3 dB,但其瞬态信号峰值多集中于-5 dB~-11 dB之间。在这种情况下,可考虑降低音量,将其定位在第二纵深区域。

素材的深度在不同的音乐段落是可变的,不同的乐曲段落可采用不同“纵深区域”处理。同时,各个素材通常按由少到多的方式分布到相应的由近及远的“纵深区域”中,这样能够有效地避免前后素材之间在形体上的相互干扰。调整深度时,除遵循“纵深区域”的处理外,还应通过编组的电平推子降低各组的分轨素材电平,以求得输出总线上的动态裕量。通常,不同编组总线上的电平推子应控制在-6 dB~-9 dB之间。

不同的瞬态变化特点,在混音中应区别对待:旋律性素材,特别是瞬态变化丰富且变化范围较大的素材,可以在两个纵深区域间活动。适量的压限可加强声音的稳定性,减少声音忽远忽近的效果。对于节奏性素材,其瞬态响应快、音色包络的动态大,瞬态峰值的变化复杂。有些打击性节奏乐器,其瞬态峰值在短期内活动范围较大,但却是规律、稳定的。对此类乐器压缩时,应特别注意忽略声音启动时段内的低频和高频。持续性声源一般声音启动较慢,瞬态峰值多不明显,动态范围小且变化慢。因此,可作较少的压缩处理。

除对素材轨道使用压限处理外,在编组总线与输出总线上使用适当的压缩和限制会使声源前后的位置结合得更紧密,从而增强音乐的整体性。但如果使用压限不当,也会导致各声源间的距离缩短,使空间变得拥挤和杂乱。因此,在总线上使用压限应注意启动时间、释放时间以及压缩量的调整。此外,各分轨音量的比例、频率的平衡以及编组总线上频率的处理,同样对编组总线的压缩结果有着重要的影响。混音开始时,在编组总线上提前添加一个预置的编组压缩和限制具有很多益处。

除了混音中的电平控制和纵深感讨论,前期录音质量对纵深稳定性的影响也不可忽视。演唱及演奏过程中突兀的忽强忽弱、乐音乐句之间因呼吸停顿而导致连贯性的缺失、录音中传声器距离过近等都会使声源瞬态峰值的活动范围及动态变得不稳定,导致在混音过程中瞬态信号峰值范围过大。

 

 调整素材的频率内容和声音细节 

频率内容和声音细节是形成纵深感的最重要的因素。由于前期录音中录音距离、传声器制式、设备性能和录音环境等因素的影响,混音师在实际工作中用到的分轨素材质量可能有很大差别。而在后期混音过程中调整纵深感,虽然可能无法改变声音的本质,但仍有一些有效的处理方法改变人耳对素材的深度印象。

 

3使用压限器限制素材瞬态峰值的活动范围 

如果素材的瞬态峰值电平在短期内活动范围过大且缺乏规律,素材的纵深感就可能失去稳定性。这时,使用压限器可以控制瞬态信号峰值变化的范围。瞬态信号峰值变化的幅度与音乐风格、乐器特点、演奏品质、录音质量有关。不稳定的电平活动会导致素材在整体中不能始终保持清晰的听感。 使用压限器应考虑素材的织体类型。根据织体的类型,素材可分为旋律性、节奏性、持续性三类。

 

4使用均衡器调整素材的频率内容 

理论上,距离的变化对声音的频率内容有两方面影响。

1.距离增加,声源高频能量会因做功过多而明显衰减;

2.距离增加会导致响度下降,含有的高低频比例降低。

以人声为例,实际中距离和频率的关系有三种。在距离非常近的情况下,声音中含有低频和高频的比例很高,中低频能量较明显;距离稍远的情况下,声音以中频为主,高低频的比例明显降低;距离非常远的情况下,声音以低频为主,中高频强烈衰减。最后这种情况在混音中很少使用,因为声能总量很低和低频充足的特征既会造成声源自身不清楚,也会被较近的乐器干扰掩盖。

运用均衡器对纵深感进行控制,应参考上述声学原理及声学现象。混音中可将整个频谱划分为低、中、高三个频段,然后考虑不同频段之间比例的控制。通常,20 Hz~250 Hz为低频范围;250 Hz~8 kHz为中频范围;8 kHz~20 kHz为高频范围。而中频范围又可再细分,250 Hz~2 kHz为基础部分、2 kHz~8 kHz为延伸部分。

 

调整纵深感应考虑乐器频率的特点,不同特点的乐器应使用不同的频率处理方式:

对贝斯、底鼓等以低频为主的乐器,提高它们的中高频可增加临场感,有拉近距离的作用;对中低频为主的声源,如军鼓、电吉他等,提升低频可使能量更强、距离更近;对频响较宽的声源,如人声、钢琴等,增加或减少低频和高频,都会很明显地影响距离感。对于旋律性乐器,衰减低频并提升中高频,可以将声源明显推远。对于色彩明亮的乐器,如打击乐、短笛等,提升中高频、衰减中低频有助于拉近距离。需要注意,高低频段的提升和衰减应在声源频率存在的前提下进行,否则只能提高噪音。此外,控制频率除可改变纵深感外,还会改变各个声音之间频率的相互掩蔽问题。因此,频率调节应根据不同的混音目的去权衡处理的尺度。 用于拉近声源距离,而不当的操作和过量的压缩限制将损害声音的动态和能量,可能把声音推远。

 

使用混响等空间类效果 

混响效果分为早期反射和后期反射两个阶段,它们对干声有着不同的作用。早期反射是指在直达声之后紧接着反射回来的、在时域上独立分离的反射,具有“声音打在墙壁上反射回来”的听感特征,这一点对纵深感起关键作用。后期反射是指起动时间较晚、声能稳定,在时域上密不可分的反射,主要用于展现声源的空间环境信息,对表现纵深的作用较少。使用混响等空间类效果,可降低素材细节、提供深度信息,使声音更远。

 

对早期反射中影响纵深感的参数的控制 

早期反射是表现声音深度最重要的因素。使用立体声制式的早期反射,可以模糊素材本身的声音细节,同时增添立体声侧反射信息。

实际运用中,某些混响器可以独立调节早期反射的参数,包括起始时间、反射时长及声能密度三个参数,声音的深度由这些参数共同作用。早期反射的起始时间是指直达声与第一次反射的时间差。这里的“第一次反射”可视为到达听音位置距离最近的侧反射。理论上,声源距离越远,早期反射相对直达声的时间差越短,反之则越长。实际混音中,分轨素材需对齐节奏,故可忽略各直达声之间的时间差。因此,实际应用中早期反射的起始时间应随距离的增加而增加,通常控制在6 ms~30 ms之间。

而有一些混响器则不具备此参数,而是以房间大小(room size)来涵盖对早期反射起始时间的控制。房间大小主要用来为素材添加空间环境信息,但对纵深感的影响同样明显。房间大小的参数设置越大,早期反射起始时间越长,反射声能整体时长越长、包络更加平直,各反射间隔越稀疏,制造的纵深感越强。其中,早期反射的时长和起动时间是影响纵深感的主要因素。

某些高端的DSP混响效果器在早期反射单元中会带有独立的、关于深度的调节参数,该参数多被命名为position、distant或depth。通过对混响与干声之间波形的相似度和相位的干涉程度进行控制,从而改变干声的细节。此参数值越大,被添加效果后干声的中间信号越模糊。

 

使用压缩器增加素材的启振频段能量及动态 

声音的距离越近,人耳对其启振频段能量的感知将越明显。恰当地使用压缩器,可以使频率内容在时域上发生变化,突出素材启振频段,使细节更明显。根据乐器的属性类别确定相应的衰减量(控制阈值及压缩比);调节压缩器的启动时间,放过乐器中高频段的启振以及低频部分;调整释放时间,改变瞬态的持续性;再次检查阈值和压缩比对峰值能量的衰减量后,通过增益恢复到素材原有的峰值电平值,使响度较弱的部分得以提升。

压缩器侧反射信号越明显,纵深感越强。如果在总线上增加一个响度表,则将深度数值增大,声音的响度有所降低,同时立体声的宽度有所增加。独立的深度参数被这些高端混响器的早期反射单元所采用,也恰恰印证了早期反射对改变声音的深度具有不可替代的观点。

除起始时间和反射时长外,早期反射的声能密度也会对素材的深度产生影响。稀疏的反射有利于较为清晰地表现声反射撞击房间墙壁的声音,对干声的染色能够明显被感知,适合表现较大的空间,可将声音推远;密集的反射则不利于表现声反射撞击房间墙壁的声音,可使声音细节损失,模糊纵深的定位。

各干声之间的电平关系和干声的直混比是一种辩证关系

较高的干声音量并不一定意味着声源在整体音乐中离听者更近,而较低的直混比也并不一定意味着声源在整体混音中声能较低。假设对两个干声添加相同的混响发送量,一个干声的瞬态峰值较高,另一个干声的瞬态峰值较低。那么两者的纵深虽然相同,但瞬态峰值较高的那个干声离听者并不近。这种情况常用于一些风格较为传统的主唱或独奏中。如同现场乐队中的独奏声部——演奏音量很大,同时混响能量也很大。混音中对混响电平的使用,主要取决于混音师对不同音乐风格纵深摆位的诠释。

 

对后期反射中影响纵深感的参数的控制 

后期反射对塑造纵深感起辅助作用。使用后期反射的混响时间和扩散程度可控制声音细节的损失程度。绝大多数混响效果器中混响时间被定义为后期反射的时长。

混响时间与干声的音强之间有密切的联系,对混响时间和混响发送量的选择以勾股定理为基础:

首先根据音乐速度设定混响时间,计算公式可参考:60 000 ms/速度×2拍或60 000 ms/速度×4拍;然后调整混响发送量以及后期混响的电平推子。

需要注意,在时域中混响电平具有动态特性。干声的瞬态峰值越高,在同一时域内得到的混响电平也将越高。假设干声中相邻的两个音符间隔0.2 s的时间;混响时间为1.2 s。两个音符一个瞬态峰值为80 dB,另一个60 dB。当第一个音符结束混响大约衰减到60 dB左右时,第二个音符开始。在这种情况下,第一个音符的混响和第二个音符的干声便音量相当、同时存在,干扰将变得明显。这是一个极端的例子,但可以肯定,不当的混响发送量对自身后续的音符会产生干扰。从另一种角度上讲,这会造成深度定位的模糊。

 

直混比的调节 

从理论上讲,直混比对声音的深度起决定作用。在室内声场中,声源距离越近,直混比越高,声能总和越大;声源距离越远,直混比越低,声能总和越小;在临界距离位置,直混比为1。通常,直混比的调整方式如下:如需声音靠前,可提高干声电平,降低混响发送电平;如需声音靠后,则反如需声音听起来很远,可将混响电平高于干声电平,甚至去掉干声,仅保留混响效果。

在直混比中对声源的深度起重要作用的应是混响中大约前200 ms内声反射电平,其对干声的声干涉最强。200 ms后的声反射多表现为声场环境感。前200 ms内的电平以早期反射的电平为主,并包含后期反射起始阶段的电平包络。对于声源干声与混响早期反射电平比例的调节有以下可能:当早期反射低于干声6 dB以内,声干涉将较为明显且会产生颤动回声效果;当早期反射低于干声6 dB~12 dB之内时,声干涉不明显,但距离感明显;当早期反射低于干声12 dB及更多时,声干涉不易察觉,距离感不明显。

根据“哈斯效应”理论,对于声源干声与混响后期反射峰值电平的比例调节有以下可能:当后期反射峰值高于干声6 dB以上时,后期反射的起始时间应控制在40 ms内无回声现象,有距离作用,但音质劣化明显;当后期反射峰值大致等于干声电平时,后期反射的起始时间控制在50 ms内无回声现象,距离感明显,音质较好;当后期反射峰值低于干声6 dB时,后期反射的起始时间可控制在80 ms内无回声现象,产生一定环境感,音质较好。

在实际混音中,为了体现空间感,混响效果器的添加一般不超过两个。使用过多空间,可能造成对空间的听觉混乱。目前计算机芯片处理能力强大,使对深度的处理有了更多的选择。 对空间纵深感的塑造还可有以下方式:

(1)增加多个辅助效果轨,使用发送的方式为不同的干声添加不同的早期反射;并使用发送的方式为不同的干声添加同一个后期混响。

(2)在方法一的基础上,使用延时效果代替早期反射。这样,中间信号细节的模糊程度要少于添加早期反射,纵深感相对弱一些。

(3)去掉早期反射,将后期反射的起动时间提前,以后期反射代替早期反射。需注意如起动时间过长,会导致干声在前、混响效果靠后的声场分离现象。

立体声信号形体与立体声的分离度有关。立体声分离度越小,声音越倾向于单声道信号的形体特点;分离度越大,声音的声像越宽。声场分布均匀的立体声信号表现为水平方向上的椭圆形;有相位抵消或分离度过大的立体声信号会出现中空的现象。提升音量以表现较近的距离时,立体声信号的宽度不会发生变化,而高度将会有一定增加。

对声音形体的调整通常由电平与频率的相互协调完成。以中低频为主的单声道军鼓信号为例:当需要将其推远时,可以针对原始素材的特点来决定采用降低电平的方式,还是采用对声音低频进行滚降,甚至对两者同时控制,但都需以获得较“瘦”的形体为目标。又如:混音中较近的单声道干声含有的低频过多,其体积较大,对其他声源产生了干扰。对这种情况除采用降低电平外,还可以通过降低低频来减小声音的形体,使声音变远。

 

对混响效果的宽度、后期反射的扩散进行调整 

在混音中,对形体轮廓是否清晰(即声源边缘的界限是否明确)常使用声聚焦进行评价。

1.通过不同的声音形体表现不同的纵深感

声音形体与纵深感在听觉方面具有潜在的对应关系,与人的视觉类似,最简单关系是“近大远小”;人耳对声音形体的感知在回放系统中比现实环境中更为明显。这一规律多应用于音乐制作领域以双声道立体声系统。 似于光聚焦,指在具有反射条件的声学环境下,在声音反射聚焦的位置声能将得到集中和增强。对干声添加混响效果,其混响声像越宽,得到的声聚焦越模糊,边缘界限越不明确。因此在添加混响时,应注意混响宽度的使用,最好使用具有立体声分离的、且声像宽度可调的混响效果器。另外,后期反射的扩散程度对形体轮廓的清晰也有影响,使用扩散过大的后期反射会导致松散的立体声成像。除形体边缘不明确外,声音深度的定位将变得模糊。使用扩散较低的后期反射使声音更加干净和通透,有利于表现准确的深度定位。

 

2.以声音形体为目标调整电平和频率

声音形体是一种与距离有关的听感印象,在调整深度时,还可以作为一种处理的目标存在。不同的形体适合不同深度的表现,其调整可参照与形体变化相关的听音现象。

当音量较小,距离较远时,以低频为主的单声道素材表现为一个点,以中频为主的单声道素材表现为一条垂直的线。当增加音量,拉近距离后,以低频为主的单声道素材会在两个音箱之间变得更宽,并且高度得以延伸(监听扬声器系统尺寸越大高度现象越明显),表现为一个球

 

3. 调整立体声的宽度和频率分布

包围感与立体感是对形体的一种心理体验。声音的宽度、高度以及低频的能量是包围感与立体感的主要成因。增强包围感和立体感能给人带来更多亲近的感受,拉近听者与声音画面的距离。

立体感与声音的响度有关。最常见的是使用压限器加强声音细节的表现。由于一般使用二分频或三分频的扬声器系统,使用压限器可使高、低频在不同的扬声器单元上得到强化,使原本扁平的声音具有立体感,从而使声音形体的感受更加清晰。 选择和实现不同的纵深感构想既是对混音能力的考验,同时也为混音带来了极大的创造空间。

 

 

让混音听上去更宽的方法:

1.叠加音轨

对于吉他和人声来说,叠加音轨的技术手法非常常见和受欢迎,因为这能达到一种宽广饱满的立体声效果。实际操作起来,叠加音轨就是在前期录音时将同一个配器录制为单独两轨,然后在后期中将其放置在声场两边。如果在录制这些复制音轨时,通过细微的音色或音质上的不同来加以区分,或是实验性地录制更多音轨、放置在更多不同的地方,则会使混音更加有意思

2.调制插件

像合唱、相位和镶边之类的调制效果器用短延迟和相位处理来创造浑厚、金属质感、梳状滤波等效果。大部分调制插件都用于立体声资源,输出不同的左右通道信号,产生令人印象深刻的立体声效果,当然,这种效果也能使单声道资源或较“窄”的资源变得更饱满。要提醒的是,调制效果会明显地改变资源声音的音色,如果你不想改变太多,就是用别的方式去扩宽声像吧。

3.延迟与哈斯效应

与混响同样常见的一种生成立体声信息的技术是延迟——将延迟拷贝信号重做声像。哈斯效应告诉我们,将一个声源复制成两轨并放置在极左极右,当延迟时间低于30ms时,你管觉不到这是两个独立的声源信号,而是觉得这是一个“宽阔”的声源。因此,通过这个原理可以让我通过延迟来制造更“宽”的声像,同时不改变声源的音色。

当延迟时间超过30ms后,我们的耳朵就能将两个信号区别开,听到传统的立体声延迟效果。与混响结合使用时,越长的延迟时间效果越明显,这可以增加混音作品的个性和营造特殊的空间感。

4.左右通道的均衡差异

立体声来自左右两个声道,我们可以通过将“两侧”信号做不同的EQ处理来使混音整体听上去更宽。举个例子,将右声道某个频段做个激励效果,再切掉左声道的相应部分频率。听上去是否有了反差和宽度了呢?