3)最小均方误差法
最小均方误差法是在维纳滤波法的基础上发展而来的,它不像维纳滤波法是由过去所有的观测值来估计当前值。最小均方误差法考察系统的每一个瞬时值,并以瞬时平方误差性能函数代替维纳滤波的均方误差性能函数,得出的结果为一个瞬时递推式,即用N-1时的值来估计N时的值。该算法的优点是对非平稳的环境噪声有较好的衰减作用,也能减少处理过程中出现的残留噪声。缺点是由于需要统计各种参数,算法运算量大,实时性不好。
此外,除了考虑语音信号和噪声信号的性质外,有些计算方法还加入了人耳对声音分析的特性,比如模拟人耳的24个频率群;模拟人耳的掩蔽效应,该掩蔽效应是指人耳不能在信号谱能量高的地方觉察出噪声的存在,是信号掩蔽噪声的情况,这与基础听力学上噪声掩蔽信号的掩蔽效应有所不同。也就是说,残留噪声强度能被语音信号掩蔽而不被人觉察就可以了,没有必要把噪声全部消除,这种处理可以减少语音信号在减噪过程中有用信号的丢失。
4)自适应滤波法
新的算法中,自适应滤波技术是在助听器中最常使用的语音增强技术之一。传统的数字滤波器的权系数是固定的,权系数在设计时根据各种可获得的语音、噪声信号参数来计算目标输出,该参数可能是来自对信号直接的估计,也可能是来自语音模型的参数。设计出的系数在使用过程中对各种信号处理时保持不变。然而在实际使用过程中,在有限的信息(相对应千变万化的信号)基础上设计出最优的权系数并非易事,这也是出现各种滤波技术及各自的改进、修正版本的原因。自适应滤波器在输入信号特性未知或者输入信号特性变化时,能够调整自己的参数,以满足某种最佳滤波准则的要求。除了普通滤波器的硬件设备外,还有软件部分,即自适应算法。
它可以按照某种事先设定的准则、算法自动调节本身的传递函数以达到所需要的输出。换句话说,它的最大特点是其工作时的滤波参数来自前一时刻输入信号的统计特征,根据事先设定的准则、算法使输出的信号能符合设计的目标。自适应算法的好坏直接影响滤波效果。按照设计最佳滤波准则不同,自适应滤波器的计算方法也相应不同。一般把自适应滤波器分为线性自适应滤波器和非线性自适应滤波器。虽然非线性自适应滤波器具有更强的信号处理能力,但由于其计算复杂度高,在目前的应用中受到限制。线性自适应滤波器的算法复杂性低,尽管对信号的处理能力有限,但目前仍然广泛地被应用。线性自适应滤波器中常见的事先约定的计算滤波的准则有最小均方误差准则(该准则认为滤波器的输出与需要信号之间的均方值差最小为最佳,这个准则与维纳滤波的准则相同,但一般的维纳滤波只能处理信号统计特性先验已知的情况,如维纳滤波器的权系数能作出改变就成为自适应维纳滤波器)、递归最小二乘算法、基于子带分解的自适应滤波算法等。其中因计算简单而使用最广泛的是最小均方误差准则和最小均方算法,后者是在前者基础上的改进。
自适应滤波法可以用于单通道信号处理,也可以用于多通道信号处理。其中自适应噪声对消技术是自适应滤波法的典型应用。后面的自适应波束形成中也有自适应滤波的计算,只是在波束形成中还涵盖了空域的参数。
5.自适应噪声对消技术
在自适应噪声对消技术中,信号的处理过程中有两个输入端:主通道输入端和参考通道输入端。主通道的信号为带噪语音信号,参考通道的作用是估计出噪声,通过调整该通道中的滤波系数使参考通道中估计的噪声最接近主通道中的噪声。这种方法降噪明显,被广泛应用于语音增强技术中,关键在于获得噪声源的复制。
6.单通道降噪与多通道降噪
(1)单通道降噪
单通道降噪是指信号的输入为单通道,多通道降噪是指信号的输入为多通道。助听器技术中单麦克风的属于单通道降噪,双麦克风或者多麦克风的属于多通道降噪。这里所讲的单、多通道不是压缩特性中的通道数。单通道降噪中语音与噪声同时存在于一个通道中,对噪声的获得没有参照数据,比较适用于噪声平稳的情况。
(2)多通道降噪
多麦克风陈列的语音增强除了它自有发展的有关算法外,同时也吸收了单麦克风语音增强的方法,如常用的语音参数模型法、谱减法和维纳滤波法都有应用到多麦克风阵列的语音增强中。两者结合更能有效地提高降噪的作用。多通道降噪中,各通道中获得的信号与噪声的数据可以相互参照,同时由多麦克风获得信息的降噪技术使得探究噪声与信号空间上的分离成为可能,即除了时域、频域的信息外,同时也可获得空间上信息的差异。助听器的多麦克风技术是助听器对来自多麦克风通道多信号源的信号通过空间滤波器来完成降噪。与单麦克风的降噪技术相比,多麦克风降噪可以增加信噪比,可以实现声源的自动定位与跟踪。人们已经提出了许多基于麦克风阵列的语音增强方法,大体可分为波束形成法和信号子空间法。其中比较经典的方法是波束形成法,包括固定波束形成、自适应波束形成和后置滤波法。在多通道语音增强中,常见的名词有麦克风阵列、波束成型、固定波束形成方法、自适应波束形成方法、具有后置滤波的波束形成法。先介绍各名词,再介绍多通道降噪中噪声场问题、语言检测问题与时延问题。
1)各名词及经典计算方法
①麦克风阵列,即一组以某种形式作空间排列的传感器单元连接到一个或多个接收信道。
利用多个麦克风拾取信号来实现语音信号处理。
②波束成型,即空间滤波。其实质是计算求和加权系数,对各阵元接收信号进行加权求和。
可以通过调制权系数,对不同方向来的信号使用不同增益。
③固定波束形成方法,也称延迟求和波束形成法。其滤波权值是固定不变的。原理是对期望语音信号在各麦克风上的相对时延进行补偿对齐再求和,即实现同相位相加,从而增强语音。
而且结构简单,计算量小。它的效果与麦克风个数、麦克风间距、噪声入射方向等有很大关系。
尤其在低信噪比的情况下,语音被噪声淹没,降噪的效果就不明显。对在非相干噪声或散射噪声情况下的作用优于相干噪声的情况。
④自适应波束形成方法。基于不同算法准则和不同的滤波器,自适应波束形成的方法也有多种,常见的有Frost宽带波束形成、自适应抵消法、广义旁瓣抵消法。Frost宽带波束形成自适应计算方法,可以用较少的麦克风取得较好的降噪效果。广义旁瓣抵消法是对Frost宽带波束形成法的修正,并成为后来许多算法的理论框架,是自适应波束形成器的一种通用模型。其包括固定波束形成器、阻塞矩阵和无约束的自适应噪声抵消器。阵列信号一路通过固定波束形成得到增强后的信号,同时该阵列信号通过一个阻塞矩阵尽量使这一路的信号阻塞语音,希望只包含噪声,完成后的信号再通过自适应滤波器,在自适应滤波器中完成对噪声的估计。最后把估计的噪声应用到另外一路的信号以减去噪声。这种计算方法当干扰噪声源数目少于麦克风数目时能达到较好的效果,但其主要的问题是这种计算方法存在无法完全阻塞语音的问题,对于非相干噪声,降噪能力反而不如传统的波束形成方法,由此也相应出现了许多修正的版本。
⑤具有后置滤波的波束形成法,是指在自适应波束形成的基础上再加用自适应维纳滤波来增强降噪效果。该方法还增强了对回响的效果。
除上述几种经典方法外,还有基于子带自适应波束形成的麦克风阵列语音增强(不同于一般的延迟求和波束形成计算只进行一次,这种计算把宽频的声音分成子频带,进行多个延迟求和波束形成计算),基于盲波束形成的麦克风阵列语音增强(是以盲源分析作为输入的基础)等等。也有学者把几种经典的方法结合使用,比如把能抑制频率成分不同的干扰信号和噪声的谱减法与具有空时滤波优势的波束成型结合使用增强效果等。无论用何种方法,都是以提高计算量为代价来换取性能的改善,很多理论在目前都难以实现,特别是在助听器中。
2)多通道降噪中噪声场问题
麦克风阵列所处的噪声场分为相干噪声场、非相干噪声场和散射场。当只有一个噪声源存在,麦克风接收的噪声只有相位和幅度上的差异时,这种情况称为相干噪声场。当麦克风接收到的噪声彼此不相干,称为非相干噪声场。在实际环境中,最常见的是散射噪声场,同时有上述两种情况。在散射场中,平面波在所有方向上随即传播,噪声是无限多个平面波的叠加,通过计算可以知道,噪声在低频段强相关,在高频段弱相关。对于自适应波束形成,其降噪能力与麦克风所处的噪声场的空间相干性密切相关。
3)多通道降噪中的语音检测问题
麦克风阵列中的语音检测一方面使后续的时延估计可以只在语音段进行,提高了估计的准确性;另一方面,检测结果也可以被其后的自适应滤波所用,使滤波器能及时更新系数,提高对噪声的判断。
4)多通道降噪中的时延问题
由于麦克风阵列对语音信号的空间采样,使得声音到达不同位置的麦克风有时间上的差异。