王 博 说
在此专栏的前两期中,我们已经介绍了波场合成(Wave Field Synthesis, WFS)和高阶Ambisonics(Higher Order Ambisonics,HOA),虽然它们都具有非常出色的声场重构能力,但对重构系统的要求也比较严格。
作为此系列的完结篇,在今天的内容中,将为您介绍一种在工业界更加常用的方法——
多通道均衡(Multichannel Equalization)。
对于一定的声场环境,例如封闭空间或者外场环境,我们想用一组传声器记录下关心区域的空间声场分布,然后在实验室里用一组扬声器重构出真实的空间声场。但这次,我们希望采集声场的传声器阵列可以是任意分布的,重构的扬声器也是任意分布的,可以吗?
从数学的角度,我们已知理想的重构信号P,对于给定的房间和扬声器分布,如果获得扬声器到重构区域的声学传递函数G,那么可以建立线性方程组GS=P,在最小二乘意义下求解扬声器的输入信号S,使得重构声场与原始声场能够很好地吻合,这样就达到了真实再现声场的目的。由于求解方程组时要对矩阵G求逆,因此很多文献也称之为求解声学逆问题,或者称为声压匹配法。
传递函数矩阵G与实际的重构环境、扬声器和传声器的布置及其电声特性有关。比如,对于某个房间或者舱室模型,低频时呈现驻波,中高频时由于墙壁和地板多次声波反射而呈现扩散场响应等,这些都体现在矩阵G中。
重构系统是否稳定,取决于计算矩阵G的伪逆,这可以由矩阵G的条件数来判断。因此,重构环境、扬声器和传声器的布置等,也不能太随意,要考虑矩阵的条件数越小越好。
什么是矩阵的条件数?
条件数=最大奇异值/最小奇异值,它表示系统对误差的敏感性。对于线性方程组,如果矩阵的条件数很大,这意味着存在微小的测量噪声,在求逆时都会被严重放大,导致系统不稳定。
从另一个角度,求解矩阵G的伪逆也可以理解为对声学传递特性做均衡,使得均衡后的整个重构系统是平直且解耦的。并且,为了保证系统的因果性,还要做适当的延迟。这样,空间采样信号经过一个平直且解耦的系统E后,还能呈现出原来的样子,因此被称为
多通道均衡方法,见图2。
有时,重构系统和环境的声学传递特性会发生变化,如温度和湿度的改变、系统电声特性的变化、受到外界干扰等,导致矩阵G发生变化,这时需要自适应闭环控制,保证系统的
实时性和稳定性。
通常,传声器的数目大于扬声器的数目,此时线性方程组是超定的,这样在最小二乘意义下令重构均方误差最小,求解方程组。由于测量过程不可避免地存在测量噪声,矩阵求逆时对噪声非常敏感,微小的噪声就会被严重放大。对于这种不适定问题,通常用截断奇异值或者Tikhonov正则化方法处理,为了确保数值稳定会过滤掉很多小的奇异值,这样会丢失很多细节信息,这于声场重构是不利的。另外,这种求解方法在重构点位置处取得很好的重构效果,但在重构点之间的区域,效果难以保证。
近年来,随着
压缩感知(Compressive Sensing)技术在声源识别和声场重构中的成功应用,利用声场的稀疏性,通过较少的空间采样就有可能
高精度地重构声场。这对实际工程应用非常有帮助。这时传声器数目小于扬声器数目,方程组是欠定的。可以利用凸优化方法,对方程组解向量施加L1范数最小化约束求解。也可以利用迭代方法,计算速度更快。
由以上可知,声场采集的精度非常关键,垃圾输入必然导致系统不稳定,降低声场重构精度。在HBK,我们提供多种高精度的传声器、声阵列和数据采集系统,确保数据采集的精度。
-
4958型1/4英寸阵列传声器,专门用于各种声阵列,在
很宽的温度和湿度范围
内都具有极佳的相位匹配特性和幅值线性特性。内置TEDS信息包含复传函信息,能够对每一只传声器进行修正,从而保证精确测量。频率范围:10-20kHz,动态范围:28-140dB。
-
4954-A或B型1/4英寸自由场传声器,用于
自由场高频高声压级测量,频率上限高达100kHz,适合于阵列测量。
-
4988-A型1/4英寸压力场传声器,可用于
靠近坚硬的反射壁面、小的封闭腔体,频率范围:20-20kHz,±1dB,动态范围:29-146dB,具有极佳的相位响应,传声器之间的频响偏差非常小,特别适合于主动噪声控制。
这几款传声器都是智能型传声器,内置TEDS使得仪器自动读取传声器的信息,并可进行不同声场环境、测量角度等的修正,从而更大程度
保证测量的准确性。


智能家电、车载语音等各种人机交互系统越来越多的出现在我们的生活中,背景噪声会严重影响语音交互的准确率,因此在
真实背景噪声环境下进行智能产品的语音测试就非常重要。为此,我们依据欧洲电信标准ETSI ES 202 396-1,推出了一套
4.1声道背景噪声回放和交互式智能语音测试与评价系统,如图4,能够在实验室条件下准确模拟不同背景噪声环境,例如办公室、咖啡厅、家庭和车内环境等,完成语音识别与唤醒率的测试与评价。
对于新一代移动终端,如多麦克风的蓝牙耳机、免提电话等,
真实噪声环境下的语音传输质量是一个非常重要的参数。欧洲电信标准协会发布了ETSI TS 103 224标准,采用基于最小二乘的多通道均衡方法,在房间内布置8个扬声器回放人头与躯干模拟器(Head and TorsoSimulator, HATS)的耳朵和嘴周围8个位置处的背景噪声。
B&K总部专家Wookeun Song博士等从
幅值重构精度和主观感知角度,对比了高阶Ambisonics(HOA)、ETSI TS 103 224和ETSI EG202 396-1的重构效果。感兴趣的读者可直接从B&K官网下载论文,见参考文献3。
加拿大学者Gauthier,P. A. 和Berry,A等在2012 –2016年前后发表了一系列文章,报道了他们利用基于伪逆和Tikhonov正则化最小二乘方法的多通道均衡技术,
重构飞机实际飞行时的舱内噪声。他们用80通道的均匀阵列放置于座位上与人耳齐平的水平面上,记录庞巴迪CRJ 900实际飞行时的舱内噪声,传声器的间距为12.5cm,空间混叠频率为1.4kHz。
他们用相同的80通道均匀阵列在舱室模型内测量激励源到阵列平面的传递函数,共获得41×80=3280个传递函数。其中壁面内饰板作动器的频率范围是80-24kHz,地板激振器的频率范围是20-1kHz,低频扬声器的频率范围是1-300Hz。
在实验室的飞机舱室模型内,他们用安装在内饰板上的36个作动器、4个激振器激励地板、1个低音扬声器重构声场。其中地板激振器和低音扬声器用于低频声场重构,内饰板地作动器用于中高频声场重构。他们重点研究了
不同正则化参数的影响,最后在
整个音频范围内取得良好的效果。

您还可以通过如下方式联系我们,了解更多产品与应用详情:
电话:400-900-3165(周一至周五9:00-18:00)