音乐厅声学的发展历程并不算漫长,声学先驱、后继者们经过不懈努力,取得了现在的成就。其中,以美国声学家白瑞纳克(L.Beranek,1914年~2016年)为代表,他的一生见证了音乐厅声学的兴起和发展,直到去世前的几个月还在JASA(Journal of the Acoustical Society of America)发表论文。2018年在汉堡易北爱乐音乐厅IOA(Institute of Acoustics,英国的一家声学权威机构)召集的会议上,声学专家交流了音乐厅声学的最新研究成果。音乐厅声学是在20世纪60年代迅速发展起来的,许多现在成果卓著的学者当时才刚刚进入这个领域,亲历和见证了音乐厅声学几十年的发展历程;英国声学家巴隆(M. Barron)对音乐厅声学发展历程进行了回顾和总结[1],在声学知识有限的当年是如何进行音乐厅声学设计,以及那些为人熟悉的声学理论诞生的前因后果。
他们的分享无疑是有特殊意义的。笔者以音乐厅声学理论发展的历史背景为线索,分别对20世纪50年代及以前、60年代和60年代以后这三个不同时期音乐厅声学的理论发展和设计实践进行简要说明,并对音乐厅声学的发展现状进行概述。
1 20世纪50年代及以前的发展状况
20世纪50年代及以前阶段为音乐厅声学理论发展的早期,声学研究成果相对较少,但足以支持两个声学期刊的正常发行,一是创刊于1927年的美国声学学会期刊JASA,二是创刊于1951年的Acustica(以英语、法语和德语三种语言发行)。虽然声学研究的活跃度较低,但所解决的问题却是非常关键的。
1.1早期理论发展
1.1.1 赛宾混响时间
美国声学家赛宾(W.C.Sabine,1868年~1919年)关于混响时间的理论和测量无疑是音乐厅声学的开创性研究。他为了解决某个新落成的礼堂音质模糊不清的问题,进行了厅堂音质方面的大量实验,并最终于1898年找到了混响时间RT与吸声量A关系的数学公式,即RT与A 成反比,与厅堂体积V 成正比,由此发明了混响时间计算公式,称为赛宾公式。赛宾时任哈佛大学物理系助教,同年,被邀请担任波士顿音乐厅声学设计顾问。混响时间至今仍是厅堂音质设计的首要指标。
1.1.2 哈斯效应
到了20世纪50年代,室内声学研究已具备一些基本技术条件。例如,能够记录声压级随时间变化曲线,有了可供查询的常用吸声材料吸声系数表以及不同用途厅堂的混响时间标准。同时,研究人员发现,仅仅混响时间不足以描述室内音质好坏。由此开启了新一轮研究工作。
这个时期的研究主要基于消声室中一个围绕听音者的多扬声器系统,如图1所示[1]。该系统主要用来模拟现场听音的反射声和混响声。最早的研究是在德国哥廷根大学开展的,第一个主要成果就是哈斯(H. Haas)于1951年提出的哈斯效应,论文发表于当年的Acustica[2]。哈斯的研究主要针对语声,指出当延时较短时(小于50 ms),允许延迟声强于直达声,而不会影响直达声的听音。这一发现对公共语言扩声有重要意义。当然,如今也在音乐扩声领域得到广泛应用。
图1 哥廷根大学实验设置示意图
1.1.3 Thiele的清晰度计算公式
前面提到,建立上述实验系统的目的是找到可以衡量厅堂音质的除混响时间外的其他声学参数。当时的想法是,从厅堂脉冲响应出发进行研究,并假设人耳诠释声音的依据是:①第一个反射声的延时,即后来白瑞纳克提出的ITDG(Initial Time Delay Gap);②在一定时间间隔内反射声的个数;③来自不同方向反射声的反射阶次;④基于声音能量的某些参数。
研究人员首先从最后一项找到了突破点。他们通过比较只有直达声和只有反射声这两种情况,发现声音清晰度从最佳变化到最差。那么,早期反射声的作用又是什么呢?根据哈斯效应,席勒(R.Thiele)认为早期声能应计入直达声中,早后期的时间分界应为50 ms,因此,于1953年提出了清晰度计算公式[3],定义为早期声能占总声能的百分比,即
其中,D 为清晰度,p(t )为所在位置的脉冲响应声压,0 ms对应直达声到达的时间。
虽然人们已经知道清晰度与混响时间有关,但在一些较大厅堂,由于声源和听音者周围缺乏反射面,尽管混响时间是合适的,听众仍然感觉清晰度不够。Thiele的研究成果解决了这个问题,标志着人们开始关注早期反射声的作用。
1.2 早期音乐厅声学设计
很多人存在疑问,在没有许多声学理论作为依据的当年,如何进行观演场所声学设计?维也纳金色大厅建于1870年,却成为世界上公认的音质最好的音乐厅之一。事实上,时至今日,音乐厅的声学设计仍然不存在所谓的最佳设计,或者可以说,人们还很难把一些对音质有意义的声学参数转换到实际的三维空间。声学设计的不确定性,导致音乐厅设计往往是建筑和功能设计占主导的结果。尽管如此,现今仍存在一些音质优良的音乐厅。
1914年之前,音乐厅体型基本上都是两个侧墙平行的鞋盒式,只有极少数采用剧院的体型,后者典型代表是建于1891年的纽约卡内基音乐厅。这个时期音乐厅墙面通常经过大量华丽装饰,从声学角度可看成扩散处理。
之后,随着建筑设计摒弃鞋盒式体型的思潮,音乐厅平面形状转变为以扇形居多,这种状态一直延续到20世纪的70年代。例如,建于1951年的伦敦皇家节日音乐厅,主体采用鞋盒式平行墙,但由于宽度较大,考虑到前端演奏台过宽,所以大厅前部采用了扇形。这个厅由于容积不足,存在混响时间偏小的问题。再如,建于1959年的波恩贝多芬音乐厅,也是扇形体型,采用了大量的扩散表面设计,这种设计思路可能与19世纪鞋盒式音乐厅的优良音质与墙面华丽装饰的扩散效果有关。
2 20世纪60年代的发展状况
2.1 20世纪60年代的理论发展
2.1.1 白瑞纳克《音乐、声学和建筑》的出版
在20世纪50年代末,白瑞纳克的声学顾问公司启动了一项对世界各地音乐厅和歌剧院进行声学测量的计划,在此背景下,白瑞纳克于1962年出版了题为《音乐、声学和建筑》的著作[4]。该书在音乐厅声学领域是开创性的,调查了54个音乐厅和歌剧院,以同一比例给出了厅堂的平面图以及内部声学设计照片,并给出混响时间频率特性曲线和其他尽可能多的测量数据。此外,白瑞纳克以演奏家和指挥家为对象进行了音乐厅音质评价调查,并与声学测量数据相关联进行分析。调查结果正如预想的那样,混响时间并不是影响音质的主要参数,由此白瑞纳克提出,初始延时ITDG是影响音质的主要参数,并将ITDG与亲切感相关联。关于ITDG的作用,其实一直存在争议[5]。
2.1.2 施罗德脉冲响应积分法和EDT (Early Decay Time)
混响时间作为厅堂音质评价的重要参数,其测量技术主要基于室内声压级随时间衰变曲线的测量。但是,由于实际厅堂不是理想的扩散声场,测得的衰变曲线并不是线性的,而是存在起伏,使得测量的可重复性变差,影响测量的准确性。解决这一问题的唯一办法是多次测量取平均,但比较耗时费力。
哥廷根大学的声学家施罗德(M.R.Schroeder)于1965年提出了测量混响时间的脉冲响应积分法[6],并首次加以应用。脉冲响应积分法等效于多次测量取平均,但只需测量一次即可得到所需的混响时间。其计算公式为
其中,E (t )为声能衰变函数,p 为房间脉冲响应声压。这种混响时间测量法比较方便准确,因此一直沿用至今。
通过多扬声器实验系统,哥廷根大学研究人员还发现,对混响感起主要作用的并不是通常定义的混响时间(根据-5 dB至-35 dB的斜率计算),更应该是前160 ms的声能衰减速率。而用实际厅堂的音乐录音进行听音实验后发现,前15 dB的衰减斜率与听音的混响感高度相关。这项研究也得益于施罗德的混响时间测量法。最后,V.L Jordan在这些研究的基础上,于1969年提出早期衰变时间EDT或称为T10,作为厅堂音质评价的又一个参数。EDT定义为以声能从0 dB至-10 dB的衰减斜率计算的混响时间,主要用于评价声音的混响感。
2.1.3 早期侧向反射声的重要性和空间感参数
1967年,新西兰声学家马歇尔(H. Marshall)首次以发表论文的形式[7],指出早期侧向反射声对改善厅堂听闻的重要性。促成马歇尔这一研究发现的背景是,当时厅堂声学设计的体型选择极度缺乏理论依据,而较窄的鞋盒式音乐厅以良好音质得到广泛认可。因此,马歇尔关注到侧向反射声的作用。马歇尔将早期侧向反射声产生的听感称为“空间响应”,并且指出,听众更偏爱在能提供更加丰富的早期侧向反射声的厅堂听音。
英国声学家巴隆(M. Barron)于1968年在南开普敦开展了针对早期侧向反射声的主观听音实验,发现空间感与早期侧向反射声能量占总声能的百分比密切相关,并将早期定义为延迟小于80 ms,为最终在1981年提出侧向能量因子奠定了基础。
在认识到早期侧向反射声对空间感的作用后,研究人员开始关注双耳效应对听音的影响,在随后几年中,相继提出了视在声源宽度ASW (Apparent Source Width)的概念和双耳互相关系数IACC (Inter-aural Crosscorrelation),认为早期侧向反射声产生的空间感可以用ASW描述,而IACC越小,空间感越强。
2.2 20世纪60年代的音乐厅声学设计
20世纪60年代的音乐厅体型仍然少有鞋盒式,大多数是扇形,也有一些其他体型如椭圆形、六角形、山地式等。下面以三个音乐厅为例,从中了解当时音乐厅声学设计状况。
纽约爱乐音乐厅建于1962年。当时,白瑞纳克所在公司承担声学顾问之职,并建议采用平行侧墙,但是最终妥协采用了扇形平面。在首演后,该音乐厅就得到听音效果不好的评价。关于声学设计哪方面出了问题,当时并没有人给出明确分析。该音乐厅于1978年进行改建,重新采用了原来的矩形平面设计。
柏林爱乐音乐厅建于1963年。音乐厅声学顾问正是德国著名声学家克莱默(L. Cremer),而建筑设计师很不喜欢乐队位于一端的平面设计导致演奏者和听众之间缺乏互动,希望演奏台位于听众区中心。克莱默对环绕式设计存在两点顾虑:一是乐器特别是演唱者的声音指向性可能使某些区域听音效果变差;二是连成一片的听众区可能缺乏早期侧向反射声。最终,声学设计必须做出妥协。克莱默的解决办法是,将听众区设计为阶梯式,并用侧板进行分区,利用侧板提供一定的早期侧向反射声。这样就诞生了世界上第一个山地葡萄园式设计。这个音乐厅的音质获得了好评,随后出现了一系列山地式音乐厅。
鹿特丹多伦音乐厅建于1966年。该音乐厅采用六边形体型,演奏台和大厅前部又设计成一个附属的六边形,最终形成一个加长的六边形体型,并且对墙面做了很高程度的扩散处理。这些设计元素综合起来,使之成为世界上公认的音质良好的音乐厅之一。
3 20世纪60年代后的发展状况
3.1 20世纪60年代后的理论发展
3.1.1 多维度主观音质评价实验
1971年Hawkes 和Douglas发表了一篇关于音乐厅音质主观评价的论文[8],标志着音乐厅音质主观评价系统性研究的开始。例如,在音乐厅现场进行问卷调查,问卷给出多个评价术语,评价术语的选择要使大多数参评者能够辨别不同术语的含义,然后收集问卷并对结果进行分析。音质主观评价的主要目的是找到对厅堂音质起主要作用的主观评价术语和客观测量参数。
3.1.2 仿真头技术在音乐厅声学的应用
在20世纪60年代发展成熟的仿真头技术,在音乐厅声学研究中得到了应用。利用音乐厅现场的仿真头录音,可以将不同音乐厅的录音带回实验室,然后用相同的被试进行主观听音实验,这样不仅解决了转场费时费力的问题,而且解决了听觉记忆时间有限带来的困扰。
主观音质评价得到了两个重要结论。第一,描述厅堂音质的主要评价术语为清晰度、混响感、包围感(或空间感)和响度。虽然响度的作用是显而易见的,但是研究结果表明,听音者对响度的敏感度大大超出预期。第二,在进行音质总体偏爱度评价时,不同听音者对不同术语所设的权重不同,如有些听音者非常看重响度,而另外一些则认为清晰度比较重要。
3.2 20世纪年代之后的音乐厅声学设计
在20世纪70年代,音乐厅声学设计依然是折衷性、选择性和实验性的,没有所谓的最佳设计,导致声学方面依然不占主导,只能采用妥协的办法。例如,椭圆形基督城市政音乐厅只能通过大反射板提供早期侧向反射声;悉尼歌剧院声学设计受制于著名的贝壳式建筑外形,声学效果并不理想。到了20世纪70年代以后,音乐厅声学设计出现回归鞋盒式的明显趋势,同时山地葡萄园式开始受到青睐。
4 音乐厅声学发展现状
音乐厅声学在20世纪60年代得到快速发展,到了80年代,已经产生了一系列客观评价测量参数,并能够通过计算机建模对设计进行一定程度的检验。但将这些客观参数付诸厅堂的实际设计并非易事。
尽管音乐厅声学早在20世纪60年代已经完成了基础性研究,但是,在完美诠释音乐厅声学之前,还有很多需要解决的问题,例如,墙面扩散面积所占百分比多少合适、在哪里设置扩散面、客观测量参数的最佳值是多少、实际厅堂应具有怎样的声学特性、到底哪些重要哪些并不重要。此外,让所有听众区而不是个别区域获得良好听闻,是一个急待解决的问题,演奏者的听闻条件也还没有得到完全解决。
21世纪以来,国内外新建音乐厅仍然以环绕式、山地式体型为主。人们偏好这类体型的主要原因是其良好的视觉效果,以及演奏者与听众的良好互动关系。事实上,其中一些音乐厅的音质并不十分理想,远没有达到优秀的水平,这一点已经引起研究人员的关注,并开始对环绕式音乐厅的听觉效果进行更加深入的研究[9],同时指出,作为音乐厅声学设计者,不应该仅仅满足于视觉带来的听感附加值,而应该最大程度地满足听众的听觉感受。
现代信息技术能够很好地模拟和处理音乐厅声音信号,其功能远远超越20世纪50年代的多扬声器系统。芬兰奥拓大学的研究人员正在实验室用最先进的模拟系统进行音乐厅声学研究[9],如图2所示。该系统采用33个不同高度的扬声器进行重放(图中只列出24个),只需输入特定技术测量的音乐厅脉冲响应,系统便能分析出直达声和早期反射声的大小和方向,馈送给相应方向的扬声器,从而在实验室模拟出整个乐队演出的现场听音。
图2 音乐厅声场模拟系统
此外,主观听感差异还可以从计算得到的声能随时间、空间和频率三个维度的变化特性看到,为分析和解决问题提供了更大的可能性。
随着信息技术的不断进步,如今的研究手段已非昔日可比,相信经过科研人员的不断努力,能够解决音乐厅声学设计仍然存在的诸多问题,使音乐厅声学设计更大程度满足人们的听觉感受。