当前体音听诊多采用基于最小均方误差准则的双通道自适应滤波算法实现环境音降噪;对于包含脉冲分量的非高斯信号,这类方法容易出现滤波器权值失调。与常用的变步长方法不同,本文引入线性预处理来克服这种现象。针对双通道归一化最小均方自适应降噪算法,分析线性预处理对于改善自适应降噪效果所起的作用,并探讨预处理环节的设计原则。分析结果表明:滤波器的稳态均方权值偏差正比于体音的方差而反比于副通道环境噪音的方差,当线性预处理参数设置得当时,可抑制体音信号中的尖峰,大幅减小体音的方差和功率谱密度,而且不明显地减小甚至可能增大副通道环境噪音的方差及其功率谱密度,如此即可减小权值失调从而显著提升环境音降噪效果。最后以心音的环境音降噪为例说明了如何设计预处理环节,并解释了它对于环境音降噪所起的作用。本文研究结果可为体音听诊的自适应降噪算法设计提供理论依据。
引用本文: 莫鸿强, 田翔, 李彬, 田军章. 线性预处理改善体音听诊自适应降噪性能的分析. 生物医学工程学杂志, 2024, 41(5): 969-976. doi: 10.7507/1001-5515.202307058 复制
0 引言
随着医疗保健服务需求的日益增长以及柔性材料[1]、微机电系统[2]和无线通信等技术的迅速发展,可穿戴生理参数采集设备的研发已成为当今热点[1-4],具有自动降噪功能的体音信号采集设备和听诊设备就是其中的典型。无论是心音[4-5]、呼吸音[3, 5-6]还是肠鸣音[1, 7]听诊,环境噪音都是影响听诊效果的主要因素之一。当环境噪音超过66~70 dBA(A计权分贝)时,采用传统听诊器就无法正常听诊[5, 8-9]。听诊过程中的环境噪音类型多样,且幅值往往远高于体音信号,会极大地妨碍人工听诊和异常体音的自动识别等[4-5]。另外,大部分环境噪音的时频分布与体音信号的时频分布高度重叠,其降噪难度较高[1, 3-6, 8-9]。
综合考虑在线听诊要求以及成本、体积、可穿戴性及续航能力[5, 8]等因素的限制,目前常用双通道自适应滤波方法进行实时降噪。其原理为:假设环境噪音为加性噪音,主通道测量带噪体音,副通道采集环境噪音,副通道所测环境噪音经处理后用于抵消带噪体音中的噪音而实现降噪[6, 10-12]。该方法实用性强,可应用于儿科诊所[6]、救护车及直升机转运[11]、航天器[12]等具高分贝环境噪音的场合。这些算法又可大致分为两类:谱减法[6, 12]和基于最小均方误差准则的自适应滤波算法。后者以最小均方(least mean square,LMS)算法、归一化最小均方(normalized LMS,NLMS)算法[9-11]及其改进算法为代表[13-15],其计算复杂度显著低于谱减法,实现成本低,特别适合于体音采集。
当前,听诊环境音自适应降噪算法的研究通常集中于如何设定或调节步长以在快速收敛和低失调(misalignment)之间实现平衡[9-11, 13-15],而较少考虑基于最小均方误差准则的算法是否适用于所有的体音信号。以心音听诊为例,第一、第二心音这类周期性出现的大幅值、短时尖峰波形(即心音属于含脉冲分量的信号)容易导致滤波器的权值周期性失调甚至发散,进而产生“额外的”输出误差。这些误差易与一些高度瞬态的心音,如收缩期拍击声、异常的第三或第四心音等相混淆,增加听诊的难度。对于心音这类包含脉冲分量的体音信号,若能针对性地设计自适应滤波算法,将会大大提升降噪效果。
脉冲干扰在主动降噪[16]、回音抑制[17-18]、系统辨识[17, 19]等应用场合广泛出现,最常见的解决办法是建立合适的代价函数,使得脉冲干扰出现时滤波器权值不至于大幅调整,从而提高算法对于脉冲干扰的鲁棒性[16-23]。例如:有的方法将脉冲干扰建模为α稳定分布过程[16, 20-21],分别基于输出误差的p范数均值[22]、输出误差的L1和L2范数组合[21]或特定约束下单步权值增量的L2范数[16]建立代价函数;有些方法以单步权值增量的L2范数限幅为约束条件,并分别基于后验误差的L2范数[18]或L1范数[19]建立代价函数;还有方法通过对输出误差引入非线性函数[17, 23]来构造代价函数。对这些代价函数进行优化,其结果往往形成变步长的自适应算法,但仍需要人为设定遗忘因子[16]、尺度缩放因子[17, 23]、单步权值增量阈值[16, 18-19]等参数,而对于听诊的自适应降噪,这些参数通常不易预先确定,因此,本文考虑采用与变步长方法不同的解决思路。
体音信号中的脉冲成分种类有限,仅幅值不确定,若能预先减小其中脉冲分量的幅值,则可大大简化降噪算法的设计。本文前期研究[24-25]仅简单地先对两个通道的信号作线性预处理,再采用NLMS算法即显著改善了环境音降噪性能,但文献[24-25]均未解释降噪效果改善的原因,无法在算法设计上形成指导性建议。鉴于此,本文将分析线性预处理对于改善自适应降噪效果所起的作用,并探讨预处理环节的设计原则。
1 NLMS滤波算法
考虑到NLMS算法收敛速度快[26],后续分析主要围绕双通道NLMS滤波算法展开;其结构如图1所示,其中的预处理及后处理
均采用线性滤波器实现,且
对应于算法不对信号作预处理。

图1中主通道信号为,其中
和
分别为第k时刻的体音和主通道环境噪音,且
和
均未知。副通道信号为环境噪音
。信号
经
预处理后得
,其中,
和
分别对应于
和
经
预处理后所得结果。信号
经
预处理后得
。自适应滤波器的最终输出为
。其余中间变量满足式(1)和式(2)的约束。
![]() |
![]() |
其中,为第
时刻自适应滤波器权值向量,
为第k时刻预处理后副通道环境噪音向量,M为自适应滤波器的阶数。
权值向量更新方式如式(3)所示,其中,
为步长控制参数。
![]() |
2 预处理H(z)的作用及其设计原则
本节先在2.1小节给出理论推导的前提假设,并明确权值偏差的定义,然后在2.2小节分析线性预处理环节对于降低稳态均方权值偏差所起的作用,进而形成
的设计原则。
2.1 假设与定义
根据体音采集/听诊过程的特点,可作如下假设:
假设1. 主、副通道的环境噪音信号与
线性相关,且它们均独立于体音信号
。
假设2. 、
和
均为均值为0的平稳遍历信号。
对一特定位置进行听诊时,需将听诊器静止按于相应位置一段时间;在该次听诊过程中,可认为与
之间的互相关函数不会发生变化。相应地可作假设3。
假设3. 主、副通道环境噪音、
的互相关函数未知,但它不随时间变化。
分别记和
的z变换为
和
;根据假设3可知,
(后文称为主、副通道环境噪音间的等效传递函数)不随时间变化。分别记
和
的z变换为
和
,依图1可知,
,
,故
,即
也与
线性相关。
令;对于实际物理系统,成立
,故当M足够大时,
近似成立。因此,自适应滤波器的最佳权值向量为
。相应地可作假设4。
假设4. 自适应滤波器阶数M足够大时,
![]() |
当时,主通道环境噪音可被完全抵消。故
与
之间的偏差可间接衡量环境音降噪效果。
自适应滤波器权值与其最佳权值之间的偏差,即,称为权值偏差。
称为均方权值偏差,记为
。而
称为均方权值偏差阵。
易知,的迹
;而均方权值偏差
越小,环境音降噪效果越佳。
假设5. 步长控制参数很小,等效步长
也很小。
当接近稳态时,为降低均方权值偏差,通常取很小的值,此时,假设5的条件成立。
2.2 预处理H(z)的作用及其设计原则
依假设4和相关定义,可通过分析预处理对
的影响来讨论它在环境音降噪过程中所起的作用。
由式(2)~(4)可得
![]() |
记,则由式(5)可得:
![]() |
根据假设1和假设2,与
相互独立,且
,故
。此外,当满足假设5所述的小步长条件时,式(3)相当于对副通道环境噪音
和体音
作低通滤波;权值
,进而权值偏差向量
,随时间的变化将比
和
随时间的变化慢得多;换言之,
及
各分量
的谱内容均与
各分量的谱内容存在显著区别,故
的变化也比
快很多。因此,可采用直接平均法[27](direct-averaging method),将
的期望值代替其自身代入式(6),得
![]() |
若取值满足
,则由式(7)可知
,即权值的估计无偏。依据相关定义,得到:
![]() |
再次运用直接平均法,考虑与
相互独立,可得式(8)等号右边第2、3项均为0,而第4项
![]() |
代入式(8)得
![]() |
进入稳态后,,故由式(10)可得
![]() |
式(11)表明,稳态均方权值偏差正比于步长控制参数的平方
和体音信号的方差
,并且反比于副通道环境噪音向量的范数均方值
。减小
、
或增大
,均有助于降低稳态均方权值偏差,亦即有助于改善环境音降噪效果。
在线估计和
并不方便,转换至频域更易于设计
。依假设2,
和
均平稳遍历,故经
处理后所得
和
亦为平稳遍历信号。根据维纳-辛钦定理,以下公式成立:
![]() |
其中,、
、
和
分别为
、
、
和
的功率谱密度。
因,
,其中,
,故若
能在降低
的同时增大或至少不明显减小
,即等效为在减小
的同时增大或至少不明显减小
及
,则可降低稳态均方权值偏差,从而改善环境音降噪效果。
综上,的设计原则为:经
处理后,体音信号的功率谱密度
应显著减小而副通道环境噪音信号的功率谱密度
应增大或不明显减小。
3 心音听诊案例讨论
本节将以心音听诊的环境音降噪为例,说明如何设计以及
是如何改善降噪效果的。
3.1 案例设计
案例设计包括两个主要环节:主、副通道信号的生成以及两通道环境噪音信号之间等效传递函数的建立。两个环节均尽可能与临床应用时的体音采集和听诊情况相符。
3.1.1 等效传递函数
的建立
将自行研发的双通道数字听诊器紧贴于大腿上,通过音箱播放M序列信号,分别测量主、副通道所拾取的信号并辨识得到。其实现细节可参考文献[28]。所得
决定于听诊器的按压力度、衣服材质等诸多因素。本节取其中一次的辨识结果
供后续分析用。
3.1.2 主、副通道信号的生成
环境噪音选用了两类典型信号,一类为在多家医院门诊和体检中心的候诊大厅自行录制的“医院嘈杂环境音”,另一类为网上公开数据库下载的“婴儿啼哭声”“说话声”“儿童呼喊声”“乐曲声”。两类信号均降采样至8 kHz,且所有噪音文件拼接为一长段信号,记为。
主通道环境噪音的生成:以3.1.1节辨识所得的
为滤波器,对
进行滤波,所得结果为
。其中,
模拟了环境噪音经人体进入听诊器主通道的传输特性。
副通道环境噪音的生成:取
,其时域曲线及语谱图参见附件1。
心音信号:对美国3M公司网站提供的正常心音信号欠采样至8 kHz后作为
。取正常心音的原因在于其第一和第二心音相对明显。
主通道信号:
,其时域曲线及语谱图分别如图2a和图2b所示。如图2a所示,
的时域曲线因第一、第二心音而周期性出现大幅值的脉冲分量。而在
的语谱图中,0~6.5 s、6.5~12 s分别因存在门诊和体检中心候诊大厅处的环境噪音,信号能量广泛分布于1 500 Hz(特别是1 000 Hz)以下较宽的频段;12~19 s因受乐曲噪音的干扰,在200~1 000 Hz之间存在明显的水平深色带状条纹;19~22 s因受儿童呼喊噪音干扰,在3 000 Hz以内多个频段存在斜向下的深色带状条纹;22~27 s因受说话噪音干扰,在1 500 Hz以下存在斜向下的深色带状条纹;27~31 s则因受婴儿啼哭噪音干扰,在500~2 500 Hz较宽的范围内亦存在深色的瞬时频率变化的条纹。


a.的时域曲线;b.的语谱图
Figure2. Curve and spectrogram of
a. curve of ; b. spectrogram of
3.1.3 最佳权值向量及权值偏差的度量
令 =
,可求得
的最大值为
,且当
时,
,近似为0。故滤波器阶数M取为150,最佳权值向量
,且
为0.489。
定义对数权值失调以衡量权值向量与最佳权值向量间的相对偏差,如式(12)所示。
![]() |
3.2 预处理的设计
考虑到第一和第二心音主要能量通常集中于150 Hz以下的低频段,而听诊过程中的典型环境噪音(例如语音、哭叫声、音乐等)主要能量的频段通常在150 Hz以上,采用了简单的一阶线性预处理,当采样频率为8 kHz时,可抑制150 Hz以下的信号而放大150 Hz以上的信号。
经预处理后,
的第一、第二心音幅值显著减小,且150 Hz以下频段的功率谱密度降低约20 dB。预处理后,
不同时段的幅值有增有减,其功率谱密度在500 Hz以下频段显著降低,而在1 000 Hz以上频段未减小,甚至在高频段会增加。统计各信号的均方值或范数均方值以分别作为
、
、
和
的估计值,依次得
、
、0.297和0.603。这些结果表明,
的峰值和均值均分别远小于
的峰值和均值;但
既可能大于也可能不大于
,两者的均值差别不大,后者甚至稍大。各信号的曲线及功率谱密度曲线参见附件2,
、
、
和
随时间变化的曲线参见附件3。
3.3 自适应滤波结果
本节分别针对固定步长控制参数的NLMS算法和一种变步长控制参数的自适应算法[19],比较其增加线性预处理前、后的滤波效果。
3.3.1 固定步长控制参数算法
前一种算法的步长控制参数取0.06。分别对比图2b带噪心音信号
和图3b及图3c降噪后信号的语谱图,均可发现,算法运行6 s后,环境噪音被显著抑制,主要表现为环境噪音对应的图2b中高亮的高频分量被显著抑制。此外,对比图3a心音和图3b无预处理自适应滤波后信号的语谱图,可以发现滤波后依然残余带状条纹,提示算法对婴儿啼哭声、说话声和乐曲声的抑制效果不够理想;尤其是在第一、第二心音处,图3a和图3b的语谱图差别更大,说明第一、第二心音对滤波器的权值更新产生负面影响。可见,无预处理的自适应降噪效果较差,无法有效抑制环境噪音。而对比图3a心音和图3c含预处理自适应滤波后信号的语谱图,两者当滤波器权值收敛后(第6 s后)差别很小,提示降噪效果较为理想。

a.;b.无预处理时的;c.含预处理时的
Figure3. Spectrograms of certain signalsa.; b. when ; c. when
采用式(12)所定义的对数权值失调可更清晰地衡量权值偏差的相对大小及降噪效果。如图4a和图4b所示,无预处理和含预处理自适应降噪算法的均可在6 s内减小到-20 dB以下。但随后无预处理自适应滤波算法的
会出现周期性的大幅波动,且其波动的时间点恰好对应于第一、第二心音出现的时刻,表明滤波器权值因受第一、第二心音的影响而周期性产生失调;而含预处理自适应降噪算法的
则持续减小且几乎不出现波动,表明其滤波器权值的收敛几乎不受第一、第二心音的影响。算法运行6 s后,统计各时刻
的均值以作为稳态均方权值偏差
的估计值,无预处理和含预处理的自适应降噪算法的结果分别为:0.507和
,前者略大于
,后者则远小于
。由此可知,含预处理的自适应滤波器对于第一、第二心音这类脉冲分量的鲁棒性要远高于无预处理的自适应滤波器。

a. 固定步长NLMS且无预处理;b. 固定步长NLMS且含预处理;c. VSS-RSA算法且无预处理;d. VSS-RSA算法且含预处理
Figure4. Logarithmic weight misalignment of a NLMS filter and that of a VSS-RSA filter with and without preprocessinga. NLMS without preprocessing; b. NLMS with preprocessing; c. VSS-RSA without preprocessing; d. VSS-RSA with preprocessing
3.3.2 变步长控制参数算法
式(11)表明,减小步长控制参数或
均有助于降低稳态均方权值偏差,且两者的作用相对独立。这意味着可以在预处理的基础上增加变步长算法,以进一步减小权值偏差和输出误差,提升环境音降噪性能。本节变步长控制参数的自适应算法采用了文献[19]提出的变步长鲁棒饱和算法(variable step-size robust saturation algorithm,VSS-RSA),该算法按式(13)所示的方式更新权值:
![]() |
其中,为饱和函数,
,且
,饱和限估计值为
![]() |
其中,初始值,而
为人工截除心音
中第一和第二心音片段后所得剩余部分信号的标准差。与文献[19]中仅对
取绝对值不同,为保证
不小于0,此处的式(14)对等式右边的分子取绝对值。
对该变步长控制参数的VSS-RSA算法,增加预处理前、后,对数权值失调
随时间变化的曲线分别如图4c和图4d所示。对比图4b和图4c可知,固定步长控制参数但增加预处理时,
收敛速度稍慢,但基本为单调减小而不会出现明显的波动;而变步长控制参数但不作预处理时,
收敛速度快,但会出现一定幅度的波动。此外,分别对比图4b和图4d、图4c和图4d可知,若同时采用变步长控制参数算法并增加预处理,则
不仅单调收敛而且收敛速度更快。
4 结论
本文分析了线性预处理对于提升自适应滤波方法在听诊环境音降噪性能上所起的作用,主要贡献为:针对双通道NLMS自适应降噪算法,① 分析并阐明了自适应滤波器的稳态均方权值偏差与体音信号方差及环境噪音方差之间的量化关系;② 基于该量化关系解释了线性预处理可改善环境音降噪效果的原因,并形成了线性预处理环节的设计原则。所形成的设计原则为:经其处理后,体音方差或功率谱密度
显著减小,而副通道环境噪音方差
或功率谱密度
不明显减小甚至增大。基于该原则的频域设计方法简单易行,且便于引入“体音信号的频谱特点”等先验知识来确定预处理环节的参数。
第3节心音听诊环境音降噪的结果表明,不管采用的是变步长控制参数还是固定步长控制参数的算法,在其余参数相同的前提下,仅简单地增加一阶线性预处理,即可有效抑制第一和第二心音等脉冲分量对自适应滤波器稳态均方权值偏差的影响而显著提升环境音降噪性能。因此,若计算资源有限,例如需要在运算能力低的单片机上实现,可只增加线性预处理,其计算量小,非常适合应用于体积和成本受限的可穿戴设备上;而若计算资源相对丰富,则可考虑同时增加变步长控制参数的自适应算法。
应指出的是,由于环境噪音和体音信号的频谱存在重叠的频段,线性预处理并不总能精细地区别对待,其灵活程度有限。本文的后续研究将针对各种体音信号,探索建立针对性更强的非线性预处理方法。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:莫鸿强负责理论推导及数据分析;田翔负责算法实现及算法验证方案设计;李彬负责算法分析;田军章负责降噪需求分析及数据收集。四位作者共同参与了论文写作。
本文附件见本刊网站的电子版本(biomedeng.cn)。
0 引言
随着医疗保健服务需求的日益增长以及柔性材料[1]、微机电系统[2]和无线通信等技术的迅速发展,可穿戴生理参数采集设备的研发已成为当今热点[1-4],具有自动降噪功能的体音信号采集设备和听诊设备就是其中的典型。无论是心音[4-5]、呼吸音[3, 5-6]还是肠鸣音[1, 7]听诊,环境噪音都是影响听诊效果的主要因素之一。当环境噪音超过66~70 dBA(A计权分贝)时,采用传统听诊器就无法正常听诊[5, 8-9]。听诊过程中的环境噪音类型多样,且幅值往往远高于体音信号,会极大地妨碍人工听诊和异常体音的自动识别等[4-5]。另外,大部分环境噪音的时频分布与体音信号的时频分布高度重叠,其降噪难度较高[1, 3-6, 8-9]。
综合考虑在线听诊要求以及成本、体积、可穿戴性及续航能力[5, 8]等因素的限制,目前常用双通道自适应滤波方法进行实时降噪。其原理为:假设环境噪音为加性噪音,主通道测量带噪体音,副通道采集环境噪音,副通道所测环境噪音经处理后用于抵消带噪体音中的噪音而实现降噪[6, 10-12]。该方法实用性强,可应用于儿科诊所[6]、救护车及直升机转运[11]、航天器[12]等具高分贝环境噪音的场合。这些算法又可大致分为两类:谱减法[6, 12]和基于最小均方误差准则的自适应滤波算法。后者以最小均方(least mean square,LMS)算法、归一化最小均方(normalized LMS,NLMS)算法[9-11]及其改进算法为代表[13-15],其计算复杂度显著低于谱减法,实现成本低,特别适合于体音采集。
当前,听诊环境音自适应降噪算法的研究通常集中于如何设定或调节步长以在快速收敛和低失调(misalignment)之间实现平衡[9-11, 13-15],而较少考虑基于最小均方误差准则的算法是否适用于所有的体音信号。以心音听诊为例,第一、第二心音这类周期性出现的大幅值、短时尖峰波形(即心音属于含脉冲分量的信号)容易导致滤波器的权值周期性失调甚至发散,进而产生“额外的”输出误差。这些误差易与一些高度瞬态的心音,如收缩期拍击声、异常的第三或第四心音等相混淆,增加听诊的难度。对于心音这类包含脉冲分量的体音信号,若能针对性地设计自适应滤波算法,将会大大提升降噪效果。
脉冲干扰在主动降噪[16]、回音抑制[17-18]、系统辨识[17, 19]等应用场合广泛出现,最常见的解决办法是建立合适的代价函数,使得脉冲干扰出现时滤波器权值不至于大幅调整,从而提高算法对于脉冲干扰的鲁棒性[16-23]。例如:有的方法将脉冲干扰建模为α稳定分布过程[16, 20-21],分别基于输出误差的p范数均值[22]、输出误差的L1和L2范数组合[21]或特定约束下单步权值增量的L2范数[16]建立代价函数;有些方法以单步权值增量的L2范数限幅为约束条件,并分别基于后验误差的L2范数[18]或L1范数[19]建立代价函数;还有方法通过对输出误差引入非线性函数[17, 23]来构造代价函数。对这些代价函数进行优化,其结果往往形成变步长的自适应算法,但仍需要人为设定遗忘因子[16]、尺度缩放因子[17, 23]、单步权值增量阈值[16, 18-19]等参数,而对于听诊的自适应降噪,这些参数通常不易预先确定,因此,本文考虑采用与变步长方法不同的解决思路。
体音信号中的脉冲成分种类有限,仅幅值不确定,若能预先减小其中脉冲分量的幅值,则可大大简化降噪算法的设计。本文前期研究[24-25]仅简单地先对两个通道的信号作线性预处理,再采用NLMS算法即显著改善了环境音降噪性能,但文献[24-25]均未解释降噪效果改善的原因,无法在算法设计上形成指导性建议。鉴于此,本文将分析线性预处理对于改善自适应降噪效果所起的作用,并探讨预处理环节的设计原则。
1 NLMS滤波算法
考虑到NLMS算法收敛速度快[26],后续分析主要围绕双通道NLMS滤波算法展开;其结构如图1所示,其中的预处理及后处理
均采用线性滤波器实现,且
对应于算法不对信号作预处理。

图1中主通道信号为,其中
和
分别为第k时刻的体音和主通道环境噪音,且
和
均未知。副通道信号为环境噪音
。信号
经
预处理后得
,其中,
和
分别对应于
和
经
预处理后所得结果。信号
经
预处理后得
。自适应滤波器的最终输出为
。其余中间变量满足式(1)和式(2)的约束。
![]() |
![]() |
其中,为第
时刻自适应滤波器权值向量,
为第k时刻预处理后副通道环境噪音向量,M为自适应滤波器的阶数。
权值向量更新方式如式(3)所示,其中,
为步长控制参数。
![]() |
2 预处理H(z)的作用及其设计原则
本节先在2.1小节给出理论推导的前提假设,并明确权值偏差的定义,然后在2.2小节分析线性预处理环节对于降低稳态均方权值偏差所起的作用,进而形成
的设计原则。
2.1 假设与定义
根据体音采集/听诊过程的特点,可作如下假设:
假设1. 主、副通道的环境噪音信号与
线性相关,且它们均独立于体音信号
。
假设2. 、
和
均为均值为0的平稳遍历信号。
对一特定位置进行听诊时,需将听诊器静止按于相应位置一段时间;在该次听诊过程中,可认为与
之间的互相关函数不会发生变化。相应地可作假设3。
假设3. 主、副通道环境噪音、
的互相关函数未知,但它不随时间变化。
分别记和
的z变换为
和
;根据假设3可知,
(后文称为主、副通道环境噪音间的等效传递函数)不随时间变化。分别记
和
的z变换为
和
,依图1可知,
,
,故
,即
也与
线性相关。
令;对于实际物理系统,成立
,故当M足够大时,
近似成立。因此,自适应滤波器的最佳权值向量为
。相应地可作假设4。
假设4. 自适应滤波器阶数M足够大时,
![]() |
当时,主通道环境噪音可被完全抵消。故
与
之间的偏差可间接衡量环境音降噪效果。
自适应滤波器权值与其最佳权值之间的偏差,即,称为权值偏差。
称为均方权值偏差,记为
。而
称为均方权值偏差阵。
易知,的迹
;而均方权值偏差
越小,环境音降噪效果越佳。
假设5. 步长控制参数很小,等效步长
也很小。
当接近稳态时,为降低均方权值偏差,通常取很小的值,此时,假设5的条件成立。
2.2 预处理H(z)的作用及其设计原则
依假设4和相关定义,可通过分析预处理对
的影响来讨论它在环境音降噪过程中所起的作用。
由式(2)~(4)可得
![]() |
记,则由式(5)可得:
![]() |
根据假设1和假设2,与
相互独立,且
,故
。此外,当满足假设5所述的小步长条件时,式(3)相当于对副通道环境噪音
和体音
作低通滤波;权值
,进而权值偏差向量
,随时间的变化将比
和
随时间的变化慢得多;换言之,
及
各分量
的谱内容均与
各分量的谱内容存在显著区别,故
的变化也比
快很多。因此,可采用直接平均法[27](direct-averaging method),将
的期望值代替其自身代入式(6),得
![]() |
若取值满足
,则由式(7)可知
,即权值的估计无偏。依据相关定义,得到:
![]() |
再次运用直接平均法,考虑与
相互独立,可得式(8)等号右边第2、3项均为0,而第4项
![]() |
代入式(8)得
![]() |
进入稳态后,,故由式(10)可得
![]() |
式(11)表明,稳态均方权值偏差正比于步长控制参数的平方
和体音信号的方差
,并且反比于副通道环境噪音向量的范数均方值
。减小
、
或增大
,均有助于降低稳态均方权值偏差,亦即有助于改善环境音降噪效果。
在线估计和
并不方便,转换至频域更易于设计
。依假设2,
和
均平稳遍历,故经
处理后所得
和
亦为平稳遍历信号。根据维纳-辛钦定理,以下公式成立:
![]() |
其中,、
、
和
分别为
、
、
和
的功率谱密度。
因,
,其中,
,故若
能在降低
的同时增大或至少不明显减小
,即等效为在减小
的同时增大或至少不明显减小
及
,则可降低稳态均方权值偏差,从而改善环境音降噪效果。
综上,的设计原则为:经
处理后,体音信号的功率谱密度
应显著减小而副通道环境噪音信号的功率谱密度
应增大或不明显减小。
3 心音听诊案例讨论
本节将以心音听诊的环境音降噪为例,说明如何设计以及
是如何改善降噪效果的。
3.1 案例设计
案例设计包括两个主要环节:主、副通道信号的生成以及两通道环境噪音信号之间等效传递函数的建立。两个环节均尽可能与临床应用时的体音采集和听诊情况相符。
3.1.1 等效传递函数
的建立
将自行研发的双通道数字听诊器紧贴于大腿上,通过音箱播放M序列信号,分别测量主、副通道所拾取的信号并辨识得到。其实现细节可参考文献[28]。所得
决定于听诊器的按压力度、衣服材质等诸多因素。本节取其中一次的辨识结果
供后续分析用。
3.1.2 主、副通道信号的生成
环境噪音选用了两类典型信号,一类为在多家医院门诊和体检中心的候诊大厅自行录制的“医院嘈杂环境音”,另一类为网上公开数据库下载的“婴儿啼哭声”“说话声”“儿童呼喊声”“乐曲声”。两类信号均降采样至8 kHz,且所有噪音文件拼接为一长段信号,记为。
主通道环境噪音的生成:以3.1.1节辨识所得的
为滤波器,对
进行滤波,所得结果为
。其中,
模拟了环境噪音经人体进入听诊器主通道的传输特性。
副通道环境噪音的生成:取
,其时域曲线及语谱图参见附件1。
心音信号:对美国3M公司网站提供的正常心音信号欠采样至8 kHz后作为
。取正常心音的原因在于其第一和第二心音相对明显。
主通道信号:
,其时域曲线及语谱图分别如图2a和图2b所示。如图2a所示,
的时域曲线因第一、第二心音而周期性出现大幅值的脉冲分量。而在
的语谱图中,0~6.5 s、6.5~12 s分别因存在门诊和体检中心候诊大厅处的环境噪音,信号能量广泛分布于1 500 Hz(特别是1 000 Hz)以下较宽的频段;12~19 s因受乐曲噪音的干扰,在200~1 000 Hz之间存在明显的水平深色带状条纹;19~22 s因受儿童呼喊噪音干扰,在3 000 Hz以内多个频段存在斜向下的深色带状条纹;22~27 s因受说话噪音干扰,在1 500 Hz以下存在斜向下的深色带状条纹;27~31 s则因受婴儿啼哭噪音干扰,在500~2 500 Hz较宽的范围内亦存在深色的瞬时频率变化的条纹。


a.的时域曲线;b.的语谱图
Figure2. Curve and spectrogram of
a. curve of ; b. spectrogram of
3.1.3 最佳权值向量及权值偏差的度量
令 =
,可求得
的最大值为
,且当
时,
,近似为0。故滤波器阶数M取为150,最佳权值向量
,且
为0.489。
定义对数权值失调以衡量权值向量与最佳权值向量间的相对偏差,如式(12)所示。
![]() |
3.2 预处理的设计
考虑到第一和第二心音主要能量通常集中于150 Hz以下的低频段,而听诊过程中的典型环境噪音(例如语音、哭叫声、音乐等)主要能量的频段通常在150 Hz以上,采用了简单的一阶线性预处理,当采样频率为8 kHz时,可抑制150 Hz以下的信号而放大150 Hz以上的信号。
经预处理后,
的第一、第二心音幅值显著减小,且150 Hz以下频段的功率谱密度降低约20 dB。预处理后,
不同时段的幅值有增有减,其功率谱密度在500 Hz以下频段显著降低,而在1 000 Hz以上频段未减小,甚至在高频段会增加。统计各信号的均方值或范数均方值以分别作为
、
、
和
的估计值,依次得
、
、0.297和0.603。这些结果表明,
的峰值和均值均分别远小于
的峰值和均值;但
既可能大于也可能不大于
,两者的均值差别不大,后者甚至稍大。各信号的曲线及功率谱密度曲线参见附件2,
、
、
和
随时间变化的曲线参见附件3。
3.3 自适应滤波结果
本节分别针对固定步长控制参数的NLMS算法和一种变步长控制参数的自适应算法[19],比较其增加线性预处理前、后的滤波效果。
3.3.1 固定步长控制参数算法
前一种算法的步长控制参数取0.06。分别对比图2b带噪心音信号
和图3b及图3c降噪后信号的语谱图,均可发现,算法运行6 s后,环境噪音被显著抑制,主要表现为环境噪音对应的图2b中高亮的高频分量被显著抑制。此外,对比图3a心音和图3b无预处理自适应滤波后信号的语谱图,可以发现滤波后依然残余带状条纹,提示算法对婴儿啼哭声、说话声和乐曲声的抑制效果不够理想;尤其是在第一、第二心音处,图3a和图3b的语谱图差别更大,说明第一、第二心音对滤波器的权值更新产生负面影响。可见,无预处理的自适应降噪效果较差,无法有效抑制环境噪音。而对比图3a心音和图3c含预处理自适应滤波后信号的语谱图,两者当滤波器权值收敛后(第6 s后)差别很小,提示降噪效果较为理想。

a.;b.无预处理时的;c.含预处理时的
Figure3. Spectrograms of certain signalsa.; b. when ; c. when
采用式(12)所定义的对数权值失调可更清晰地衡量权值偏差的相对大小及降噪效果。如图4a和图4b所示,无预处理和含预处理自适应降噪算法的均可在6 s内减小到-20 dB以下。但随后无预处理自适应滤波算法的
会出现周期性的大幅波动,且其波动的时间点恰好对应于第一、第二心音出现的时刻,表明滤波器权值因受第一、第二心音的影响而周期性产生失调;而含预处理自适应降噪算法的
则持续减小且几乎不出现波动,表明其滤波器权值的收敛几乎不受第一、第二心音的影响。算法运行6 s后,统计各时刻
的均值以作为稳态均方权值偏差
的估计值,无预处理和含预处理的自适应降噪算法的结果分别为:0.507和
,前者略大于
,后者则远小于
。由此可知,含预处理的自适应滤波器对于第一、第二心音这类脉冲分量的鲁棒性要远高于无预处理的自适应滤波器。

a. 固定步长NLMS且无预处理;b. 固定步长NLMS且含预处理;c. VSS-RSA算法且无预处理;d. VSS-RSA算法且含预处理
Figure4. Logarithmic weight misalignment of a NLMS filter and that of a VSS-RSA filter with and without preprocessinga. NLMS without preprocessing; b. NLMS with preprocessing; c. VSS-RSA without preprocessing; d. VSS-RSA with preprocessing
3.3.2 变步长控制参数算法
式(11)表明,减小步长控制参数或
均有助于降低稳态均方权值偏差,且两者的作用相对独立。这意味着可以在预处理的基础上增加变步长算法,以进一步减小权值偏差和输出误差,提升环境音降噪性能。本节变步长控制参数的自适应算法采用了文献[19]提出的变步长鲁棒饱和算法(variable step-size robust saturation algorithm,VSS-RSA),该算法按式(13)所示的方式更新权值:
![]() |
其中,为饱和函数,
,且
,饱和限估计值为
![]() |
其中,初始值,而
为人工截除心音
中第一和第二心音片段后所得剩余部分信号的标准差。与文献[19]中仅对
取绝对值不同,为保证
不小于0,此处的式(14)对等式右边的分子取绝对值。
对该变步长控制参数的VSS-RSA算法,增加预处理前、后,对数权值失调
随时间变化的曲线分别如图4c和图4d所示。对比图4b和图4c可知,固定步长控制参数但增加预处理时,
收敛速度稍慢,但基本为单调减小而不会出现明显的波动;而变步长控制参数但不作预处理时,
收敛速度快,但会出现一定幅度的波动。此外,分别对比图4b和图4d、图4c和图4d可知,若同时采用变步长控制参数算法并增加预处理,则
不仅单调收敛而且收敛速度更快。
4 结论
本文分析了线性预处理对于提升自适应滤波方法在听诊环境音降噪性能上所起的作用,主要贡献为:针对双通道NLMS自适应降噪算法,① 分析并阐明了自适应滤波器的稳态均方权值偏差与体音信号方差及环境噪音方差之间的量化关系;② 基于该量化关系解释了线性预处理可改善环境音降噪效果的原因,并形成了线性预处理环节的设计原则。所形成的设计原则为:经其处理后,体音方差或功率谱密度
显著减小,而副通道环境噪音方差
或功率谱密度
不明显减小甚至增大。基于该原则的频域设计方法简单易行,且便于引入“体音信号的频谱特点”等先验知识来确定预处理环节的参数。
第3节心音听诊环境音降噪的结果表明,不管采用的是变步长控制参数还是固定步长控制参数的算法,在其余参数相同的前提下,仅简单地增加一阶线性预处理,即可有效抑制第一和第二心音等脉冲分量对自适应滤波器稳态均方权值偏差的影响而显著提升环境音降噪性能。因此,若计算资源有限,例如需要在运算能力低的单片机上实现,可只增加线性预处理,其计算量小,非常适合应用于体积和成本受限的可穿戴设备上;而若计算资源相对丰富,则可考虑同时增加变步长控制参数的自适应算法。
应指出的是,由于环境噪音和体音信号的频谱存在重叠的频段,线性预处理并不总能精细地区别对待,其灵活程度有限。本文的后续研究将针对各种体音信号,探索建立针对性更强的非线性预处理方法。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:莫鸿强负责理论推导及数据分析;田翔负责算法实现及算法验证方案设计;李彬负责算法分析;田军章负责降噪需求分析及数据收集。四位作者共同参与了论文写作。
本文附件见本刊网站的电子版本(biomedeng.cn)。