购买

¥20.0

加入VIP
  • 专属下载券
  • 上传内容扩展
  • 资料优先审核
  • 免费资料无限下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 语音信号处理课件第十一章

语音信号处理课件第十一章.ppt

语音信号处理课件第十一章

中小学精品课件
2019-05-19 0人阅读 举报 0 0 0 暂无简介

简介:本文档为《语音信号处理课件第十一章ppt》,可适用于工程科技领域

数字语音处理及MATLAB仿真张雪英编著*第十一章语音增强概述语音感知特性和噪声特性语音增强算法数字语音处理及MATLAB仿真张雪英编著*概述在通信过程中语音受到来自周围环境、传输媒介引入的噪声使接收到的语音信号并非纯净的原始语音信号而是受噪声污染的带噪语音信号。这里的“噪音”定义为所需语音信号以外的所有干扰信号。干扰信号可以是窄带的或宽带的、白噪声的或有色噪声的、声学的或电学的、加性的或乘性的甚至可以是其它无关的语音。由噪声导致的语音质量的下降会使许多语音处理系统的性能急剧恶化。数字语音处理及MATLAB仿真张雪英编著*采用语音增强技术进行预处理可有效地改善系统性能。语音增强的目标:对收听人而言主要是改善语音质量提高语音可懂度减少疲劳感对语音处理系统(识别器、声码器、手机)而言是提高系统的识别率和抗干扰能力。数字语音处理及MATLAB仿真张雪英编著*目前国内外有关抗噪声技术的的研究成果大体分为三类解决方法:采用语音增强算法提高语音识别系统前端预处理的抗噪声能力提高输入信号的信噪比寻找稳健的语音特征作为特征参数实验证明这类参数对宽带语音具有较好的抗噪性基于模型参数自适应的噪声补偿算法。数字语音处理及MATLAB仿真张雪英编著*解决噪声问题的根本方法是实现噪声和语音的自动分离但由于技术的难度这方面的研究进展不大。近年来随着声场景分析技术和盲分离技术的研究发展利用在这些领域的研究成果进行语音和噪声分离的研究取得了一些进展。数字语音处理及MATLAB仿真张雪英编著*语音增强与语音信号处理理论有关而且涉及到人的听觉感知和语音学。噪声来源众多随应用场合不同而特性各异因此难以找到一种通用的语音增强算法可以适用于各种噪声环境必须针对不同环境下的噪声采取不同的语音增强策略。因此要进行语音增强首先要了解语音特性、人耳感知特性和噪声特性。数字语音处理及MATLAB仿真张雪英编著*语音感知特性和噪声特性语音特性语音信号具有短时平稳性声道形状有相对稳定性在一段时间内(ms~ms)人的声带和声道形状是相对稳定的可认为其特征是不变的因而语音的短时谱具有相对稳定性在语音分析中可以把语音信号分为若干分析帧每一帧的语音可以认为是准稳定的。语音增强可以利用这种短时平稳性。数字语音处理及MATLAB仿真张雪英编著*语音信号可以分为浊音和清音语音可以分为周期性的浊音和非周期性的清音。在语音增强中可以利用浊音的周期性特征采用梳状滤波器提取语音分量或者抑制非语音信号而清音则难以与宽带噪声区分。数字语音处理及MATLAB仿真张雪英编著*语音信号可以利用统计分析特征描述作为一个随机过程语音信号可以利用许多统计分析特征进行分析。语音的短时谱幅度统计特征是时变的只有当分析帧长趋于无穷大时才能近似具有高斯分布。在高斯模型的假设中可以认为傅里叶展开系数是独立的高斯随机变量均值为零而方差是时变的。在有限帧长时这种高斯模型只是一种近似的描述可以作为分析的前提在宽带噪声污染的带噪语音增强中应用。数字语音处理及MATLAB仿真张雪英编著*人耳感知特性人耳对语音的感知主要是通过语音信号频谱分量幅度获取的对各分量相位则不敏感对频率高低的感受近似与该频率的对数值成正比。人耳具有掩蔽效应人耳除了可以感受声音的强度、音调、音色和空间方位外还可以在两人以上的讲话环境中分辨出所需要的声音这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关称为“鸡尾酒会效应”。数字语音处理及MATLAB仿真张雪英编著*语音增强的最终效果度量是人耳的主观感觉所以在语音增强中可以利用人耳感知特性来减少运算代价。数字语音处理及MATLAB仿真张雪英编著*噪声特性根据与输入语音信号的关系噪声可分为加性噪声和非加性噪声两类。对某些非加性噪声而言可以通过一定的变换转换成加性噪声。语音处理中的加性噪声大体上可以分为周期性噪声、脉冲噪声、宽带噪声和同声道其他语音的干扰等。数字语音处理及MATLAB仿真张雪英编著*.周期性噪声周期性噪声主要来源于发动机等周期性运转的机械电气干扰也会引起周期性噪声。特点是频谱上有许多离散的线谱。实际信号受多种因素的影响线谱分量通常转变为窄带谱结构而且通常这些窄带谱都是时变的位置也不固定。必须采用自适应滤波的方法才能有效地区分这些噪声分量。数字语音处理及MATLAB仿真张雪英编著*.脉冲噪声脉冲噪声来源于爆炸、撞击、放电及突发性干扰等。特征是时间上的宽度很窄。在时域消除脉冲噪声过程如下:根据带噪语音信号幅度的平均值确定阈值。当信号超出这一阈值时判别为脉冲噪声。然后对信号进行适当的衰减就可完全消除噪声分量也可以使用内插方法将脉冲噪声在时域上进行平滑。数字语音处理及MATLAB仿真张雪英编著*.宽带噪声宽带噪声来源很多热噪声、气流噪声及各种随机噪声源、量化噪声都可以视为宽带噪声。宽带噪声与语音信号在时域和频域上基本上重叠只有在无话期间噪声分量才单独存在。因此消除这种噪声比较困难。对于平稳的宽带噪声通常可以认为是白色高斯噪声。数字语音处理及MATLAB仿真张雪英编著*.同声道语音干扰干扰语音信号和待传语音信号同时在一个信道中传输所造成的语音干扰称为同声道语音干扰。区别有用语音和干扰语音的基本方法是利用它们的基音差别。考虑到一般情况下两种语音的基音不同也不成整数倍这样可以用梳状滤波器提取基音和各次谐波再恢复出有用语音信号。数字语音处理及MATLAB仿真张雪英编著*.传输噪声这是传输系统的电路噪声。处理这种噪声可以采用同态处理的方法把非加性噪声变换为加性噪声来处理。数字语音处理及MATLAB仿真张雪英编著*通过语音增强技术改善语音质量的过程如下图所示:数字语音处理及MATLAB仿真张雪英编著*语音增强算法目前语音增强算法大致可以分为四种:参数方法非参数方法统计方法其它方法数字语音处理及MATLAB仿真张雪英编著*参数方法此类方法主要依赖于使用的语音生成模型(例如AR模型)需要提取模型参数(如基音周期、LPC系数)常常使用迭代方法。如果实际噪音或语音条件与模型有较大的差距或提取模型参数有困难则此类方法容易失效。采用滤波器模型时典型的有梳状滤波器、维纳滤波器、卡尔曼滤波器等。数字语音处理及MATLAB仿真张雪英编著*语音的全极点生成模型如图所示:图语音的全极点生成模型数字语音处理及MATLAB仿真张雪英编著*语音的全极点生成模型中激励源为:u(n)增益因子为:g语音信号为:s(n)全极点滤波器为:根据全极点模型有s(n)为清音时u(n)为宽带噪声s(n)为浊音时u(n)为间隔是基音周期T的脉冲串数字语音处理及MATLAB仿真张雪英编著*非参数方法非参数方法不需要从带噪信号中估计模型参数因此这种方法的应用范围较广。但由于没有利用可能的语言统计信息故结果一般不是最优化的。这类方法包括自适应噪声抵消法、谱减法等。数字语音处理及MATLAB仿真张雪英编著*自适应噪声抵消法图自适应噪声抵消原理图自适应滤波器y(n)=s(n)d(n)v(n)r(n)e(n)增强语音数字语音处理及MATLAB仿真张雪英编著*设带噪语音输入为y(n)=s(n)d(n),s(n)为语音信号d(n)为未知噪声信号r(n)参考噪声输入也即自适应滤波器的输入v(n)是该滤波器的输出。r(n)与s(n)无关而与d(n)相关。自适应滤波器原理:在输入过程的统计特性未知或是输入过程的统计特性变化时能够调整自己的参数以满足某种最佳准则的要求。自适应滤波的目的就是通过对r(n)的滤波使输出的噪声估值v(n)尽可能接近带噪语音中的d(n)然后从带噪语音中直接减去v(n)达到语音增强的目的。数字语音处理及MATLAB仿真张雪英编著*自适应滤波器通常采用FIR滤波器系数采用最小均方误差(MMSE)准则来迭代估计。判断标准是使误差信号e(n)能量最小:其中wk是滤波器系数N是滤波器抽头数。MMSE准则要求噪声和语音相互独立这时误差信号e(n)能量最小可保证v(n)与d(n)最接近。数字语音处理及MATLAB仿真张雪英编著*.谱减法是利用噪声的统计平稳性以及加性噪声与语音不相关的特点而提出的一种语音增强方法。没有使用参考噪声源但它假设噪声是统计平稳的即有语音期间噪声幅度谱的期望值与无语音间隙噪声的幅度谱的期望值相等。用无语音间隙测量计算得到的噪声频谱的估计值取代有语音期间噪声的频谱与含噪语音频谱相减得到语音频谱的估计值。此类语音增强方法将估计的对象放在短时谱幅度上。数字语音处理及MATLAB仿真张雪英编著*图谱减法原理图图中y(n)经FFT变换后有Yk=SkNk由此可得:�EMBEDEquationDSMT����EMBEDEquationDSMT����EMBEDEquationDSMT����EMBEDEquationDSMT����EMBEDEquationDSMT����EMBEDEquationDSMT����EMBEDEquationDSMT����EMBEDEquationDSMT���相位恢复IFFT�EMBEDEquationDSMT���FFTunknownunknownunknownunknownunknownunknownunknownunknownunknown数字语音处理及MATLAB仿真张雪英编著*由于和相互独立所以和独立而为零均值的高斯分布所以有:对于一个分析帧内的短时平稳过程有:为无语音时的统计平均值则原始语音的估计值如下其中是增强后的语音信号的幅度数字语音处理及MATLAB仿真张雪英编著*定义及后验信噪比上式可改写为:()()式()中当小于时将失去意义。因此将式()改写为其中是个大于零的常数。数字语音处理及MATLAB仿真张雪英编著*谱相减的物理意义:相当于对带噪语音的每一个频谱分量乘以一个系数。信噪比高时含有语音的可能性大衰减系数小。反之则认为含有语音的可能性小衰减系数大。谱减法在频域将带噪语音的功率谱减去噪声的功率谱得到纯净语音功率谱估计开方后就得到语音幅度谱估计用带噪语音的相位来近似纯净语音的相位再采用反傅里叶变换恢复时域信号。数字语音处理及MATLAB仿真张雪英编著*谱减法优点:比较简单只需要进行正反傅立叶变换而且实时实现较容易。谱减法缺点:适用的信噪比范围较窄在信噪比较低时对语音的可懂度损伤较大。所以实际应用时除了要降低噪声外还要兼顾语音的可懂度和自然度。由于频谱直接相减会使增强后的语音产生“音乐噪声”它具有一定的节奏性听上去类似音乐声由此而得名。数字语音处理及MATLAB仿真张雪英编著*统计方法统计方法较充分地利用了语音和噪音的统计特性一般要建立模型库需要训练过程获得初始统计参数它与语音识别系统的联系很密切。如最小均方误差估计(MMSE)、利用听觉掩蔽效应等。对于语音增强来说听觉意义上的失真准则与给定噪声情况下语音频谱的后验分布是无法知道的因此对于特定的失真准则和后验概率不敏感的估计方法是很有用处的。数字语音处理及MATLAB仿真张雪英编著*大部分语音的变化是比较缓慢的帧与帧之间的频谱有着一定的相似性其相应频谱分量之间存在某种相关性这种相关性可以反映在前一帧的频谱值对后一帧频谱的分布产生一种约束影响。由此产生了基于帧间频谱分布约束的MMSE估计方法。人耳对声音强度的感受是与谱幅度的对数成正比的同时语音处理的实践也表明采用对数失真准则更为适合一些。为此可得到频域分布约束的短时对数谱的MMSE估计。数字语音处理及MATLAB仿真张雪英编著*MMSE算法优点:达到了语音可懂度和清晰度的折衷适用信噪比的范围较广MMSE算法缺点:由于需要统计各种参数算法运算量大实时性不好。数字语音处理及MATLAB仿真张雪英编著*应用听觉掩蔽效应进行语音增强语音信号能够掩蔽与其同时进入听觉系统的一部分能量较小的噪声信号而使得这部分噪声不为人感知利用一个功率谱域的基于听觉掩蔽门限的不等式准则动态选择一个参数自适应变化的非线性函数估计语音短时谱幅度从而实现语音增强。数字语音处理及MATLAB仿真张雪英编著*其他方法其他方法包括小波变换、卡亨南洛维变换(KLT)、离散余弦变换(DCT)、人工神经网络等。这些方法不像前三类方法那样成熟可以概括地称为非主流方法。数字语音处理及MATLAB仿真张雪英编著*谱减法语音增强的仿真实现图谱减法流程图增强后的语音去除汉明窗引起的增益短时IFFT并各帧重叠相加频域中合成语音将差值置为零差值>短时噪声幅度谱估计短时相位谱短时幅度谱短时FFT加汉明窗帧间重叠带噪语音产生随机白噪声读入语音文件YN数字语音处理及MATLAB仿真张雪英编著*

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

评分:

/39

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利