首页 基于特征分类直方图均衡的鲁棒性语音识别研究

基于特征分类直方图均衡的鲁棒性语音识别研究

举报
开通vip

基于特征分类直方图均衡的鲁棒性语音识别研究基于特征分类直方图均衡的鲁棒性语音识别研究 苏州大学 硕士学位论文 基于特征分类直方图均衡的鲁棒性语音识别研究 姓名:吴荣娣 申请学位级别:硕士 专业:电子与通信工程 指导教师:俞一彪 2010-10 摘要 基于特征分类直方图 均衡的鲁棒性语音识别研究 基于特征分类直方图均衡的鲁棒性语音识别研究 中文摘要 语音识别技术经过全球半个多世纪的研究,目前已经发展到了接近 实用的阶段。在实验室环境下,大词汇量的朗读式连续发音宽带语音信 号的平均识别率可以达到 90[%] 以上,但具体到实际应用中...

基于特征分类直方图均衡的鲁棒性语音识别研究
基于特征分类直方图均衡的鲁棒性语音识别研究 苏州大学 硕士学位论文 基于特征分类直方图均衡的鲁棒性语音识别研究 姓名:吴荣娣 申请学位级别:硕士 专业:电子与通信 工程 路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理 指导教师:俞一彪 2010-10 摘要 基于特征分类直方图 均衡的鲁棒性语音识别研究 基于特征分类直方图均衡的鲁棒性语音识别研究 中文摘要 语音识别技术经过全球半个多世纪的研究,目前已经发展到了接近 实用的阶段。在实验室环境下,大词汇量的朗读式连续发音宽带语音信 号的平均识别率可以达到 90[%] 以上,但具体到实际应用中,由于说话人 的变化、环境条件的变化以及噪声等因素的影响,会使识别系统的性能 急剧下降。在理论上,噪声鲁棒性所面临的问题其实就是训练和识别环 境之间的不匹配,而这种不匹配通常都会体现在特征参数概率分布的差 异上。特征参数规整可以通过特征空间的参数变换映射在一定程度上减 小训练和应用环境的不匹配程度,进而提升系统的识别性能。本文主要 尝试采用改进的直方图均衡(HEQ )方法进行非特定人语音识别系统的 鲁棒性研究,通过特征空间的特征参数直方图均衡处理改善识别系统抗 噪声性能,提高识别系统在噪声环境下的鲁棒性。实验表明,本文提出 的算法可以有效地提高低信噪比环境下非特定人语音识别系统的识别 率。 关键词:语音识别;直方图均衡化;Mel 频率倒谱系数;隐马尔可夫 模型 作 者:吴荣娣 指导教师:俞一彪 2 Robust Speech Recognition based on Feature Classification Histogram Equalization Abstract Robust Speech Recognition based on Feature Classification Histogram Equalization Abstract After more than half century research, speech recognition systems have become nealy applicable. In the laboratory, recognition rate of continuous speech with large amount of words is beyond 90[%]. But in the working environment, the recognition performance degrades significantly due to different human, enrivonment and noise. The problem of robust noise is the environmental mismatch between training and recognition. This mismatch generally lies in the difference of feature parameter probability distribution. Normalization of feature parameters can be realized through parameter transform of feature space and relief the mismatch between training and application to improve recognition performance of the system. In this paper, an improved Histogram Equalization (HEQ) method is proposed for robust speech recognition system, which improved the anti-noise property of the recognition system quite successful. Experiment results show that the proposed method can significantly improve the recognition rate of the system under environment with low signal to noise ratio. Keywords: speech recognition; histogram equalization; Mel-frequency cepstral coefficient; hidden Markov model Written by WU Rong-Di Supervised by YU Yi-biao II III 基于特征分类直方图均衡的鲁棒性语音识别研究 第一章 绪 论 第一章 绪 论 语音识别技术经过半个多世纪的研究,目前已经发展到了接近实用 的阶段。在实验室环境下,大词汇量的朗读式连续发音宽带语音信号的 平均识别率可以达到 90[%] 以上,但具体到实际应用中,由于说话人的变 化、环境条件的变化以及噪声等因素的影响,会使识别系统的性能急剧 下降。因此,如何提高语音识别系统的噪声鲁棒性以达到真正实用的目 的是当前研究领域中迫切需要解决的主要问题。本章首先介绍语音识别 研究的背景和意义,然后概述语音识别的研究现状和存在的问题,最后 给出本文的主要研究内容和章节安排。 1.1 语音识别概述 语音识别的研究背景和意义 语音识别就是机器将语音信号转变为相应的文本文字或命令的技 术,现代语音识别是用电子计算机从人的语言波形中提取信息,并确定 其语言含义的过程。在计算机大学科中,它是智能计算机的智能接口科 学,在信息处理大学科中,它是信息识别的一个重要分支。这一技术的 应用将从根本上改变计算机的人机界面,从而对计算机的发展及推广应 用产生深远的影响。 语音识别的应用领域非常广泛,常见的应用系统有: (1)语音输入系统,相对于键盘输入方法,它更符合人的日常习惯, 也更自然、更高效; (2 )语音控制系统,即用语音来控制设备的运行,相对于手动控制 来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家 电、声控智能玩具等许多领域; 1 第一章 绪 论 基于特征分类直方图均衡的鲁棒性语音识别研究 (3 )智能对话查询系统,根据客户的语音进行操作,为用户提供自 然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系 统、订票系统、医疗服务、银行服务、股票查询服务等等。 除此之外,语音识别还可以用于口语翻译系统、计算机辅助教学、 [[]1] [[]2] 。语音识别是一门新兴的交叉学科,所涉及 自动身份确认等诸多领域 的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉 机理、人工智能等等。因此可以预见,语音技术必将对工业、金融、商 业、文化、教育等诸方面产生革命性的影响,这是一项具有巨大应用推 广前景的工程。正是由于这一点,一些主要先进国家都非常重视语音识 [[]3] 别技术的研究 。 语音识别的研究现状及存在问题 1、语音识别研究现状 20 世纪50 年代,语音识别技术的研究即已开始。1952 年Bell 实验 [[]4] 室开发的第1 个可识别10 个英文数字的语音识别系统――Audry 系统 。 1959 年,Rorgie 和Forge 采用数字计算机识别英文原音和孤立词,从此 开始了计算机语音识别。 20 世纪 60 年代,计算机的应用推动了语音识别的发展。动态规划 (DP :Dynamic Programming )和线性预测分析技术(LP :Linear Predictive analysis )就是该时期的重要成果,而后者则成为了最有效的语音分析技 术之一,也是低位速下编码方法高质量语音最有用的方法之一,它能够 提供非常精确的语音参数预测,较好地解决了语音信号模型的问题,对 语音识别的发展产生了深远影响。 60 年代末、70 年代初,语音识别领域取得了突破。在理论上,LP 技术得到进一步发展,动态时间规整技术(DTW :Dynamic Time Warping ) 基本成熟,特别是提出了矢量量化(VQ :Vector
本文档为【基于特征分类直方图均衡的鲁棒性语音识别研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_482581
暂无简介~
格式:doc
大小:20KB
软件:Word
页数:0
分类:企业经营
上传时间:2017-11-30
浏览量:7