首页 麦克风阵列拓扑结构对语音增强系统性能影响的理论分析

麦克风阵列拓扑结构对语音增强系统性能影响的理论分析

举报
开通vip

麦克风阵列拓扑结构对语音增强系统性能影响的理论分析麦克风阵列拓扑结构对语音增强系统性能影响的理论分析 麦克风阵列拓扑结构对语音增强 系统性能影响的理论分析 王冬霞,赵光,郑家超 (辽宁工业大学 电子与信息工程学院,辽宁 锦州 121001) 摘 要:在免提通信系统中,麦克风阵列往往用于噪声和混响环境下的语音拾取。基于常用的麦克风阵列拓 扑结构,推导了一个麦克风空间摆放对麦克风阵列性能影响的准则。仿真试验结果验证了理论分析的结论,即麦 克风阵列的拓扑结构的确影响着语音增强系统的性能,优化的麦克风阵列摆放可以在一定程度上改善语音质量。 关键词:麦克风阵列;语...

麦克风阵列拓扑结构对语音增强系统性能影响的理论分析
麦克风阵列拓扑结构对语音增强系统性能影响的理论分析 麦克风阵列拓扑结构对语音增强 系统性能影响的理论分析 王冬霞,赵光,郑家超 (辽宁工业大学 电子与信息工程学院,辽宁 锦州 121001) 摘 要:在免提通信系统中,麦克风阵列往往用于噪声和混响环境下的语音拾取。基于常用的麦克风阵列拓 扑结构,推导了一个麦克风空间摆放对麦克风阵列性能影响的准则。仿真试验结果验证了理论分析的结论,即麦 克风阵列的拓扑结构的确影响着语音增强系统的性能,优化的麦克风阵列摆放可以在一定程度上改善语音质量。 关键词:麦克风阵列;语音增强;拓扑结构 中图分类号:TN912 文献标识码:A 文章编号:1674-3261(2010)01-0001-04 Theoretial Analysis of the Effects of Microphone Array Placement on Speech Enhancement System WANG Dong-xia, ZHAO Guang, ZHEN Jia-chao (Electron & Information Engineering College, Liaoning University of Technology, Jinzhou 121001, China) Key words: microphone array; speech enhancement; array configuration Abstract: In the hands-free communication systems where the noise and reverberation coexisted, microphone arrays were always used for the speech acquisition. The criterion was derived to evaluate the influence of spatial microphones placement on the systems. Simulation results verified that the microphone array configuration really affected the performance of speech enhancement system and the optimal microphones placement was able to improve the speech quality significantly. 所谓麦克风阵列是指在空间按一定几何规则布置的一组麦克风。麦克风阵列融合了信号的空时信息,已经广泛地被用来在诸如视频会议远程通信和车载系统等免提通信环境下的语音增强。目前,关于麦克风 阵列语音增强算法方面的研究较多。根据阵列信号处理的理论,阵元的优化摆放对阵列处理系统性能具有 [1,2]重要影响。因此,一个性能良好的麦克风阵列系统,除需要一个性能较好的算法外,麦克风阵列的拓扑 结构也是影响麦克风阵列系统性能的主要因素之一。在语音增强和定位算法中,有许多常用的麦克风阵列 [3]拓扑结构。然而,关于阵列的优化摆放和阵列系统性能之间的关系这方面的研究相对较少。 本文的目的是,就给定的麦克风阵列语音增强方法,提出一种用于评价麦克风阵列拓扑结构性能的准 则。本文的结构安排如下:首先评价近场环境下声波传播问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 ,然后对语音增强中常见的麦克风阵列拓扑 结构的评价准则进行推导,最后对理论推导结果进行评价。 1 声学模型 [4] 球面坐标系下,近场环境下声波 v(r,θ ,φ, t) 的波动方程为 收稿日期:2009-04-14 基金项目:国家自然科学基金项目(60901063);辽宁省教育厅项目(2009A359) 作者简介:王冬霞(1975-),女,辽宁海城人,副教授,博士。 2222 1 ? v1 ??v 1?v?v?v1 2 (r) +inφ ) += (1) (s 2 2 2 2 2 2 2r?r ? r r sinφ ?φ ?φ rsinφ? θc?t ?1 式中: c =3 40 ms为声速。 考虑到仅对那些球对称的解感兴趣,波动方程可以简化为 2 1 ? ?v 1 ? v2 (2) (r ) = 2 2 2r ?r ? r c ?t Monochromatic 解为 A v(r, t) = expj ωt ? kτ (3) () { }r 设 p 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示第 i 个麦克风位置,与参考麦克风i(=0)相对应,第 i 个麦克风接收到的信号为i x(t ) =v (t ? p? p/ c) =v (t ) ? h(t )(4) i v 0 v ,i 式中: h(t ) 表示第 i 个麦克风和声源之间的房间冲激响应。 v ,i 设感兴趣的声源为 s(t) ,N 个干扰源 n(t) ,则式(4)可以进一步表示成 l N x(t) = αs(t) ? h(t) + αn(t) ? h(t) (5) i s,i s,i ?n ,i n ,i l l l l =0 式中: s(t) 和 n(t) 与式(3)定义相类似。 l 为避免麦克风信号 x(t) 的空间偏移,麦克风间距为最高频率所对应波长的一半 i λ (6) d? 2 于是,滤波-求和波束形成器输出信号为 M ?1M ?1N y(t) = x(t) ?g(t) = s(t) α+αn(t) ? h(t) ?g(t) (7) ? i i ? s,i ?n ,i n ,i i l l l i =0i =0l =0 式中: g(t) 满足 g(t) ? h(t) = 1 ,这使得每个麦克风感兴趣的信号成分对齐。 i i s,i 下面,推导一个准则来评价不同拓扑结构麦克风阵列的系统性能。2 算法推导 2.1 波束图 一个阵列通常由方向因子 DI(r,θ ,φ, f ) 刻画,某种程度上具体体现抑制噪声的能力。对于给定的阵列 摆放和声源定位来讲,它可以定义为 DI H ( p, p, f ) s =DI(r,θ ,φ, f ) =DI( p, p, p, f ) = s n l 1 H ( p, p , p , f )dp n s ?l 4π p M ?1 p-p 1 s 0 exp(? j2πfp-p / c) exp( j2πf p -p / c) + i s i ? ?1M p -p p -p i =0s i s 1 ? p-pi =0 s 0 M ?1 N ?1 p-p n 11 l exp(? j 2πf(8) ? p-p) / c) p-p/ c) exp( j2πf ( p-p ?? in is i l =0 l =0p-pi M ?1 N ?1 p-p n in l0 l ?? p-p i =0 l =0 n 0l 式中:P( i = 0… M ?1 )表示波达方向的位置矢量。i 2.2 信噪比 SNR(ζ , p, p) 是另一个评价麦克风阵列性能的有效准则。按照式(7),可以表示成 i s 2 M ?1 s(t) α? s,i i =0 SNR(ζ , p, p) = 10 log= i s 102 M ?1 N ?1 αn(t) ? h(t) ? g(t) ? ?n ,i n ,i i l l l i =0 l =0 2 M ?1 p? p s 0 s(t) ? p? p i =0s i 10 log(9) 102 M ?1 N ?1 p? p n 0 l n(t) ? h(t) ? g(t) ?? l n ,i i l p ? pi =0 l =0 ni l 式中: h (t ) 依赖于房间特性函数ζ ,它包括墙反射系数,房间的表面及和体积。对于语音增强来讲,信 n,i l 噪比, SNR(ζ , p, p) 是衡量麦克风阵列摆放的较好的准则。 i s 3 仿真实验 [5]实验选取小会议室环境。房间大小为 5 m×4 m×3 m,房间冲激响应采用 Image 模型模拟。按照 Eyring 公式,混响时间 T可以表示成60 0.163V T (10) = 60 ?S log(1 ? γ ) 式中:V 是房间容积;S 是房间表面积;γ 是墙壁反射系数。 设麦克风阵列接收到语音信号频率范围 300~3 400 Hz. 实验选取一个由 9 个麦克风组成的 3 种麦克风 阵列拓扑结构,用来评价上述准则。考虑到实际应用,阵列孔径限在 40 cm 范围内。如图 1 所示,阵列语 音增强系统中较常用的麦克风阵列包括线阵、嵌套阵和面阵,线阵其间隔为 5 cm (a),嵌套阵列其间隔分 别为 2.5 cm、5 cm 和 10 cm (b),面阵其间隔为 5 cm、10 cm 和 15 cm (c)。 (a)均匀线阵 (b)嵌套线阵 (c)面阵 图 1 常见的麦克风阵列拓扑结构 采用最简单的延时求和波束形成方法进行语音增强。期望声源位于离麦克风中心 50 cm 处,本地噪声 源位于离阵列 100 cm,入射角为 60 cm 的地方。3 种麦克风阵列拓扑结构的波束图分别如图 2、图 3 和图 4 所示。 图 2 线阵的波束图 图 3 嵌套阵的波束图 图 4 平面阵的波束图 图 5 阵列输出信噪比 观察图 2~图 4,分别反映了 3 种不同麦克风阵列拓扑结构的波束图。对于均匀间隔的线阵来讲,频率 对波束图有较大的影响。而这将影响到自适应波形成中低频信号的抵消。与其他所描述的结构相比,面阵 取得了较好的方向性。 环境中的噪声取高斯白噪声。如图 5 所示,不同麦克风阵列所对应的 SNR. 从图中可以看到,在混响 时间 300 ms 情况下,SNR 随着阵元间隔的变化而变化。和上面描述的其他结构相比,嵌套阵列有更高的 输出 SNR. 结束语4 该文推导了评价麦克风阵列优化摆放对阵列语音增强系统性能影响的准则。仿真实验结果表明,对于 有限数目的麦克风阵列,均匀线阵不能提供充分的空间采样。嵌套线阵和面阵可以用来有效地改善语音性 能,就方向性和信噪比而言,面阵性能优于其他两种。 参考文献: [1] Brandstein M, Ward D. Microphone Arrays: Signal Processing Techniques and Applications[M]. Berlin: Springer, 1996. [2] Jacob Benesty, Jingdong Chen, Yiteng Huang. Microphone Array Signal Processing[M]. Berlin: Springer, 2008. [3] 王冬霞, 殷福亮, 陈喆. 麦克风阵列系统时延估计的 Cramer-Rao 限[J]. 电子学报, 2008, 36(12): 175-179. [4] C. Coulson A. Jefirey, Waves: A Mathematical Approach to the Common Types of Wave Motion Longman[M]. London: U.K., 1977. [5] J. B. Allen, D.A. Berkley. Image method for efficiently simulating small room acoustics[J]. Journal of the Acoustic Society of America, 1979, 65(10): 943-950. 责任编校:孙 林 file:///D|/我的资料/Desktop/新建文本文 档.txt Appliance Error (configuration_error) Your request could not be processed because of a configuration error: "Could not connect to LDAP server." For assistance, contact your network support team. file:///D|/我的资料/Desktop/新建文本文档.txt2012-07-12 20:42:52
本文档为【麦克风阵列拓扑结构对语音增强系统性能影响的理论分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_842972
暂无简介~
格式:doc
大小:54KB
软件:Word
页数:0
分类:生活休闲
上传时间:2017-12-20
浏览量:33