王博聊声学 | 声场重构技术之三：多通道均衡

HBK声学与振动

2021年8月11日 13:31

浏览：3116 收藏：1

王博说

在此专栏的前两期中，我们已经介绍了波场合成（Wave Field Synthesis, WFS）和高阶Ambisonics（Higher Order Ambisonics，HOA），虽然它们都具有非常出色的声场重构能力，但对重构系统的要求也比较严格。

那有没有简单一点的方式重构声场呢？

作为此系列的完结篇，在今天的内容中，将为您介绍一种在工业界更加常用的方法—— 多通道均衡（Multichannel Equalization）。

王博聊声学

什么是多通道均衡?

对于一定的声场环境，例如封闭空间或者外场环境，我们想用一组传声器记录下关心区域的空间声场分布，然后在实验室里用一组扬声器重构出真实的空间声场。但这次，我们希望采集声场的传声器阵列可以是任意分布的，重构的扬声器也是任意分布的，可以吗？

图1

从数学的角度，我们已知理想的重构信号P，对于给定的房间和扬声器分布，如果获得扬声器到重构区域的声学传递函数G，那么可以建立线性方程组GS=P，在最小二乘意义下求解扬声器的输入信号S，使得重构声场与原始声场能够很好地吻合，这样就达到了真实再现声场的目的。由于求解方程组时要对矩阵G求逆，因此很多文献也称之为求解声学逆问题，或者称为声压匹配法。

传递函数矩阵G与实际的重构环境、扬声器和传声器的布置及其电声特性有关。比如，对于某个房间或者舱室模型，低频时呈现驻波，中高频时由于墙壁和地板多次声波反射而呈现扩散场响应等，这些都体现在矩阵G中。

重构系统是否稳定，取决于计算矩阵G的伪逆，这可以由矩阵G的条件数来判断。因此，重构环境、扬声器和传声器的布置等，也不能太随意，要考虑矩阵的条件数越小越好。

什么是矩阵的条件数？

条件数=最大奇异值/最小奇异值，它表示系统对误差的敏感性。对于线性方程组，如果矩阵的条件数很大，这意味着存在微小的测量噪声，在求逆时都会被严重放大，导致系统不稳定。

从另一个角度，求解矩阵G的伪逆也可以理解为对声学传递特性做均衡，使得均衡后的整个重构系统是平直且解耦的。并且，为了保证系统的因果性，还要做适当的延迟。这样，空间采样信号经过一个平直且解耦的系统E后，还能呈现出原来的样子，因此被称为 多通道均衡方法，见图2。

有时，重构系统和环境的声学传递特性会发生变化，如温度和湿度的改变、系统电声特性的变化、受到外界干扰等，导致矩阵G发生变化，这时需要自适应闭环控制，保证系统的 实时性和稳定性。

图2

如何求解扬声器的输入信号？

通常，传声器的数目大于扬声器的数目，此时线性方程组是超定的，这样在最小二乘意义下令重构均方误差最小，求解方程组。由于测量过程不可避免地存在测量噪声，矩阵求逆时对噪声非常敏感，微小的噪声就会被严重放大。对于这种不适定问题，通常用截断奇异值或者Tikhonov正则化方法处理，为了确保数值稳定会过滤掉很多小的奇异值，这样会丢失很多细节信息，这于声场重构是不利的。另外，这种求解方法在重构点位置处取得很好的重构效果，但在重构点之间的区域，效果难以保证。

近年来，随着 压缩感知（Compressive Sensing）技术在声源识别和声场重构中的成功应用，利用声场的稀疏性，通过较少的空间采样就有可能 高精度地重构声场。这对实际工程应用非常有帮助。这时传声器数目小于扬声器数目，方程组是欠定的。可以利用凸优化方法，对方程组解向量施加L1范数最小化约束求解。也可以利用迭代方法，计算速度更快。

怎样保证声场重构的精度？

由以上可知，声场采集的精度非常关键，垃圾输入必然导致系统不稳定，降低声场重构精度。在HBK，我们提供多种高精度的传声器、声阵列和数据采集系统，确保数据采集的精度。

传声器：

4958型1/4英寸阵列传声器，专门用于各种声阵列，在 很宽的温度和湿度范围 内都具有极佳的相位匹配特性和幅值线性特性。内置TEDS信息包含复传函信息，能够对每一只传声器进行修正，从而保证精确测量。频率范围：10-20kHz，动态范围：28-140dB。
4954-A或B型1/4英寸自由场传声器，用于 自由场高频高声压级测量，频率上限高达100kHz，适合于阵列测量。
4988-A型1/4英寸压力场传声器，可用于 靠近坚硬的反射壁面、小的封闭腔体，频率范围：20-20kHz,±1dB，动态范围：29-146dB，具有极佳的相位响应，传声器之间的频响偏差非常小，特别适合于主动噪声控制。

这几款传声器都是智能型传声器，内置TEDS使得仪器自动读取传声器的信息，并可进行不同声场环境、测量角度等的修正，从而更大程度 保证测量的准确性。

图3

LAN-XI数据采集系统：

王博聊声学 | 声场重构技术之三：多通道均衡的图5

王博聊声学 | 声场重构技术之三：多通道均衡的图6

应用案例

用于智能家居语音识别与唤醒率测试的背景噪声回放

智能家电、车载语音等各种人机交互系统越来越多的出现在我们的生活中，背景噪声会严重影响语音交互的准确率，因此在 真实背景噪声环境下进行智能产品的语音测试就非常重要。为此，我们依据欧洲电信标准ETSI ES 202 396-1，推出了一套 4.1声道背景噪声回放和交互式智能语音测试与评价系统，如图4，能够在实验室条件下准确模拟不同背景噪声环境，例如办公室、咖啡厅、家庭和车内环境等，完成语音识别与唤醒率的测试与评价。

图4

用于移动终端通话质量评估的背景噪声回放

对于新一代移动终端，如多麦克风的蓝牙耳机、免提电话等， 真实噪声环境下的语音传输质量是一个非常重要的参数。欧洲电信标准协会发布了ETSI TS 103 224标准，采用基于最小二乘的多通道均衡方法，在房间内布置8个扬声器回放人头与躯干模拟器（Head and TorsoSimulator, HATS）的耳朵和嘴周围8个位置处的背景噪声。

B&K总部专家Wookeun Song博士等从 幅值重构精度和主观感知角度，对比了高阶Ambisonics（HOA）、ETSI TS 103 224和ETSI EG202 396-1的重构效果。感兴趣的读者可直接从B&K官网下载论文，见参考文献3。

飞机舱内声场重 构

加拿大学者Gauthier,P. A. 和Berry,A等在2012 –2016年前后发表了一系列文章，报道了他们利用基于伪逆和Tikhonov正则化最小二乘方法的多通道均衡技术， 重构飞机实际飞行时的舱内噪声。他们用80通道的均匀阵列放置于座位上与人耳齐平的水平面上，记录庞巴迪CRJ 900实际飞行时的舱内噪声，传声器的间距为12.5cm，空间混叠频率为1.4kHz。

他们用相同的80通道均匀阵列在舱室模型内测量激励源到阵列平面的传递函数，共获得41×80=3280个传递函数。其中壁面内饰板作动器的频率范围是80-24kHz，地板激振器的频率范围是20-1kHz，低频扬声器的频率范围是1-300Hz。

在实验室的飞机舱室模型内，他们用安装在内饰板上的36个作动器、4个激振器激励地板、1个低音扬声器重构声场。其中地板激振器和低音扬声器用于低频声场重构，内饰板地作动器用于中高频声场重构。他们重点研究了 不同正则化参数的影响，最后在 整个音频范围内取得良好的效果。

王博聊声学 | 声场重构技术之三：多通道均衡的图8