首页 基于EMD法的语音信号特征提取

基于EMD法的语音信号特征提取

举报
开通vip

基于EMD法的语音信号特征提取基于EMD法的语音信号特征提取 中文核心期刊 《微计算机信息》(管控一体化)2007 年第 24 卷第 5-期3 软 件 时 空 文章编号:1008- 0570(2007)05- 3- 0228- 02 基于 法的语音信号特征提取EMD Fe a tu re Extra ctio n o f S p e e ch S ig n a l Ba s e d o n Em p irica l Mo d e De co m p o s itio n 录电子测试技术国家重点实验室 中北大学信息与通信工程学院杨(& )...

基于EMD法的语音信号特征提取
基于EMD法的语音信号特征提取 中文核心期刊 《微计算机信息》(管控一体化)2007 年第 24 卷第 5-期3 软 件 时 空 文章编号:1008- 0570(2007)05- 3- 0228- 02 基于 法的语音信号特征提取EMD Fe a tu re Extra ctio n o f S p e e ch S ig n a l Ba s e d o n Em p irica l Mo d e De co m p o s itio n 录电子测试技术国家重点实验室 中北大学信息与通信工程学院杨(& ) Y A N G LU摘要特 征 提 取 是 目 标 识 别 的 关 键如 何 从 有 限 的 测 量 数 据 中 获 取 有 效 可 靠 的 特 征 参 数是 特 征 提 取 中 重 点 考 虑 的 问 题 本: , 、, 。 文 采 用 方 法 对 语 音 信 号 进 行 频 率 特 征 提 取 可 以 较 好 地 降 低 语 音 信 号 的 冗 余 度 实 验 结 果 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 明 方 法 是 处 理 非 平 EMD , , : EMD 稳 信 号 的 有 效 方 法它 运 用 于 语 音 信 号 特 征 提 取 是 可 行 的 , 。 关键词语音信号频率特征 : ; EMD; 中图分类号文献标识码:TN912 :B Abstr act:Feature extraction is the key to object recognition. How to obtain effective, reliable characteristic parameter from the limited measured data is a question of great importance in feature extraction. In this paper, EMD is used to extract frequency feature of a speech signal, which can better reduce its redundancy. EMD is an effective method for processing non - stationary signal. It is feasible to extract frequency feature of speech signals with EMD. Key wor ds:speech signal, EMD, fr equency featur e 两个极值之间的时间间隔定义特征时间尺度如果全部数 ; ( 3) 引言 1 据不包含极值点而仅仅含有拐点那么可以通过微分一次或多, 语音信号特征的提取是语音信号处理的基础而语音特征 , 次求得极值最后的结果能通过分量的积分获得, 。的提取又是 通 过 对语 音 信 号的 分 析 来获 得 表 征语 音 信 号的 参 经验 模 态分 解 法 是通 过 经 验数 据 的 特征 时 间 尺 度 辨 别 内 数的长期以来人们对语音信号都是采用短时处理技术的这 。, 。禀性震荡模式然后按照它分解数据称为筛选过程此分解法, , , 是因为语音信号是一个非平稳过程其特性是随着时间而变化 , 分別找出局部极大值和局部极小值所有极大值的插值曲线连。的但又是渐 变的 由 于 语音 的 变 化比 较 缓 慢在 一 小 段时 间 , 。, 接作为包络的上界所有极小值的插值曲线连接作为包络的下 , 内可以认为语音信号是平稳的时不变的基于此就可以将 , 、。, 界包络的上下界将覆盖所有的数据设原始数据为 将极 , 。X(t), 语音信号分成一些相续的短段称其为帧进行处理当分帧足 ( ) , 大值包络和极小值包络的代数均值标记为 并且标记原始数 m1 够小时非线性系统可以用线性系统来近似从而产生了诸如线 。 据与 的差为 即mh,:1 1 性预测同态卷积正交变换等短时线性分析方法但随着这种 、、。 ( )1线性分 析方 法 的 研究 不 断 深人 短 时 处理 技 术 呈现 出 许 多不 , 此时的 不一定是内禀模态函数实际上有过调和欠调现 h。1 足主要表现在语音识别合成编码等系统的性能难以进一步 , 、、象发生而且 对 于 非平 稳 数 据包 络 均 值可 能 不 同于 真 正 的局, , 提高所以有必要对语音信号的非线性特性进行深人研究, , 。 部均值不论数据被筛选过多少次一些不对称图形仍然存在, , 。 于 年 提 出 一 种 新 的 非 平 稳 信 号 的 分 析 方 Huang 1998 筛选 过 程的 两 个 目的 是 删 除骑 型 波 以及 使 得 波 剖 面 更 加 法经验模态分解法经验模态分解法利用信号的局 ———( EMD) 。对称为此筛选的过程不得不重复多次在第二次筛选过程中, 。, 部 特 征 时 间 尺 度 从 原 信 号 中 提 取 出 若 干 个 内 禀 模 态 函 数, ( 当作原始信号找出的极大值极小值包络线然后求得 的 h, 、, h1 1 和 一 个 残余 量 分 解出 的 各 个 分 量 突 出 了 数 据 的 局 , IMF) IMF 均值包络线 即, m11 部特征残余分 量体 现 了 信号 中 的 缓慢 变 化 量对 它 们 进行 分 , , ( 2)析可以更准确有效地把握原数据的特征信息, 。 经过两次筛选过程后所得的 更加对称但是仍然有局 h, 11 部极大 值并 非 为 正因 此 必 须再 继 续 做筛 选 经 过 次 筛 选 过 , , k 经验模态分解方法 2 程的结果 已经完全符合一个内禀模态函数的条件可 以 用h, , 1k经验 模 态分 解 法 就是 将 输 入信 号 分 解成 多 个 带 有 物 理 特 数学式表示成 : 性的内禀模态函数而内禀模态函数就如同傅里叶转换中的正 , (3)弦余弦函数为希伯特黄变换的基底在经验模态分解法中较 、。将它标记为 : 特別的是其基底的求得是由分解原输入信号而得, 因此有下列 (4)限制条件数据最少有两个极值即最大值和最小值由 : ( 1) , ; ( 2) 是出于数据的第一个内禀模态分量整体来说应该 c。, c1 1 是包含信号中最佳的时间尺度或者是最短周期的分量可以从 。杨 录副教授: 原来信号中分离出 r: 1资金项目国家自然基金基于特征重建的 算 法 研究 “” : 3D- CT (5)项目资助( )60602041 - - 360元 /年 邮局订阅号82-946 228 : 《现场总线技术应用 200 例》 您的论文得到两院院士关注软 件 时 空余数 包含较长周期分量把它当成新的数据再运用上述 r, 1 可表示成其后的 , r: 相同的筛选过程将之处理1 (6) 当余数 变成常数或单调函数而无法提取出内禀模态函 r, n 数即停止。 将式和式相加最后可以得到 (5)(6), : ( 7) 由式可完成将一个数据分解成 个内禀模态函数及一 (7), n 个缓慢变化的趋势或一个恒量。 语音信号频率特征提取方法3 提取说话人语音信号特征的过程实际上就是去除原来语 , 音中的冗余信息减小数据量的过程特征参数应具有以下几 , 。 个特点一是能 有效 区 分 不同 的 说 话人 同 时 对同 一 说 话人 来 : , 二是容易从语音信号中 ; 讲发音发生变化时能保持相对的稳定 提取三是不易模仿; 。 本文通过 方法获得语音信号的频率特征信息即对 EMD , 输入语音信号先做 分解获得六个内模函数再对各内模 EMD , 函数作 获得其频谱提取各内模函数频谱主能量频率值作 FFT , 为特征向量 提取方法如图 所示, 1 。 如汉语语音的元音的时域波形及其频谱如图 所示频 [e]2 。 率特征提取过程如图 所示对输入语音信号做 分解获1 , EMD 的傅立叶变换图 3 IMF1,IMF6 得六个内模函数后分别对各内模函数作 获得的频谱如图 , FFT 得到元音的特征向量为由图 3 [e]:所示 。 3 语音信号特征比对分析4 采用上述方法对同一人的汉语语音的元音和辅音[o]、[e][b]、 进行实验实验材料来自于 中的录音机采集的作者的 [d], windows 发音采用单声道量化的语音其特征如表 采用上 , 、8kHz、8bit 。1。 特征如表 所示[b] 2 。述方法对不同人的汉语语音的辅音 同一人各元音辅音特征向量表表 1 、图 语音信号的频率特征 获取方法 1 EMD 表 甲乙人元音特征向量表2 、[b] 图 元音的时域波形及其频谱2 [e] 分析 表 可以 看 出 元音和 辅 音的 特 征 向 量 在 1 [o]、[e][b]、[d] 这些信号在高频上的差别表明了 , 高频部分数值上有很大差别几乎是相同 ,它们是不同人的语音信号而特征向量的低频部分。的这就表明这些不同的语音信号是由同一个人发出的由表 , 。1 还可 以 看出 元 音和特 征 向 量 在 高 频 部 分 数 值 接 近 辅 音 [o][e] , 和特征向量在高频部分也很接近这一现象说明了元音 [b][d] 。 这一点由特征向量就可以看出辅, , 之间在发音上是有其共性的音亦然由表 可以看出甲乙两个人虽然发的都是辅音的 。2 [b] 音但特征向量有着显著的差别下转第 页, 。 (245 ) 邮局订阅号元 年 - - : 82-946 360 /229 《P LC 技术应用 200 例》 您的论文得到两院院士关注 软 件 时 空 设 阀 值 为 时 则 为 用 户 所 需 要 的 比那 么 当 码技术和概率知识实现了手写输入法中字符识别技术避免了 a, Mat(R) , R , 传统手写输 入法 中 字 符识 别 技 术的 平 滑 除噪 归 一 化等 预 处 、、较好选择当 时则不列入结果中对于查询属性多于, Mat(R)< a 。 理过程提取特征少具有简单快速的特点又由于在系统中 , , 、。两个的情况类似并可进行嵌套控制查询。 采用了有效的解决容错性问题的方法因而系统的准确率高, 。 实践证 明本 文 提 出的 基 于 矢量 特 征 编码 的 手 写字 符 识 别技 术 结束语6 是一种有效的字符识别技术。 本文 在 有穷 自 动 机思 想 的 基础 上 建 立了 一 个 模 糊 查 询 控 参考文献制的模型实现 查 询的 模 块 化这 样 的 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 有 利 于模 型 的 具体 , , 张冬霞基于 和 的联机手写体汉字识别系统微 [1].ANN HMM [J]实现聚类将数据对象的集合分组成多个簇在同一簇中的对 。, 计算机信息,,杜彦蕊,李珍,宋伟宏基于特征编码的200514 [2].象具有较高的相似度而不同簇的分类根据给定条件而不断变 , 手写字符识别技术计算机工程,,:孙星[J]. 200430(5)156- 158. [3]化但是模型还有很多有待完善之处例如如何实现真正的自 。, 明,杨茂江,刘国华,等完全基于结构知识的汉字笔画抽 取方.动查询如何建立一个接收查询信息的精确的有穷自动机的模 法, 计算机研究与发展,,():孙家广计算机[J].2000375543- 550. [4].图形学第三版北京:清华大学出版社,朱学芳多媒体型等等()[M].2002. [5]., 。 信息处理与检索技术北京:电子工业出版社,[M].2002. 创新点在有穷自动机思想的基础上建立了一个模糊查询 : 作者简介任民宏男在职研究生讲师陕西理工学 : , ( 1970- ) , , , ( 控制的模型在 此 基础 上 实 现查 询 的 模块 化 将 整个 控 制 系统 , , 院 计 算 机科 学 与 技术 系 主 要 研 究 方 向 计 算 机 图 形 , 723003) , : 分为两个部分即数据分析处理和具体的查询控制在这个模 , 。图像处理。E- mail: rmh9605@126.com。 型中探讨了有穷自动机思想的引入在应用上丰富和发展了计 , 算智能理论。 Biogr aphy:Ren Minhong,Male( 1970 - ) ,Inserver postgraduate,in- structor, ( Department of Computer Science & Technology,Shaanxi 参考文献 University of Technology, Hanzhong Shaanxi, China,723003 ) ,ma- [1]Yeh, M. S., and S. M. Chen. 1994 A new method for fuzzy query processing using automatic clustering techniques[J]Journal of – Computers 6(1):110.mail : joring in computer graphics and image processing. E - 陈基漓,牛秦洲最大树模糊聚类算法在商务网站中的应用 [2]. rmh9605@126.com. 微计算机信息 2006 4- 3: 203- 205 陕西陕西理工学院任民宏) (723000 吕映芝,张素琴,蒋维杜编译原理第一版北京:清华大 [3]. [M]. 通讯地址陕西陕西理工学院任民宏:(723000 ) 学出版社,1998 1:52 收稿日期修稿日期(:2007.4.03)(:2007.5.05) 陈逸菲基于模糊理论的关系数据库查询技术研究[4]. [D]CNKI:: CDMD:10300.2.2005.5842 2005.6.29 p5~11 上接第 页(229 ) 作者介绍张颖超汉男江苏徐州人教授硕士生导 : (1960—), (), , , 由此可见采用 方法获得的语音信号特征向量可以从 , EMD , 师主要研究领域系统控制与 仿 真 网络 控 制 技术 。: , 。E- mail: 数值上更直观更有效地在频域上分辨出元音的不 , [o]、[e]、[b]、[d] 同并且可以由特征向量分析出语音是否是同一个人发出的, 。 汉 傅 玲 玲女 江 苏 南 京 人 硕 candylingfu@sina.com, (1982—), (), , 士研究生研究方向计算机仿真 , : E- mail: candylingfu@sina.com 本文作者创新点提出一种可以较好地降低语音信号的冗 : Biogr aphy:Zhang Yingchao(1960 - ), male, Suzhou Jiangsu, Pro- 余度的频率特征提取方法法- EMD 。 fessor and graduate Tutor , research area: system control and 参考文献emulation, network control; Fu Lingling(1982 - ), female, Nanjing 王永琦邓琛李世超杨洋噪声环境中基于 汉语说话人 [1],,,.GMM 识别微计算机信息王宏禹非平稳信号[J].,2005,11- 2:177- 179 [2].Jiangsu, graduate, study area: computer emulation 分析与处理北京国防工业出版社[M].:, 傅玲玲江苏 南京信息工程大学信息与通信系张颖超) (210044 1999: 245- 380 通讯地址江苏 南京信息工程大学信息与通信系:(210044 ) [3]Huang N E ,Shen Z , Long S R ,et al. The empirical mode 张颖超decomposition and the Hilbert spectrum for nonlinear and 收稿日期修稿日期(:2007.4.03)(:2007.5.05) nonstationary time series analysis [J]. Pro. Roy. Soc. Lond. A.1998 ,454 :903 - 905 上接第 页(222 ) 作者 简 介杨 录男汉内 蒙 古 乌盟 人 中 北大 学 信 息 与 : (1968- ), (), , 通信工程学院副教授主要从事信号处理和超声检测技术研究 ,。 Biogr aphy:Yang Lu (1968 - ), male (Han nationality), Born in Wumen of Inner Mongolia, associate professor of College of Information and communication Engineering of North University of China. Research interests: signal processing ultrasonic and detection technology. E- mail: tyzyhzyh@126.com 山西山西省太原市中北大学信息与通信工程学院(030051 ) 图 实验中采用的用户界面8 杨录 山西 山西省太原市中北大学信息与通信通讯地址:(030051 结束语4 工程学院杨录 ) 本文 的 创新 之 处 在于 巧 妙 地结 合 矢 量字 符 的 矢 量 方 向 编收稿日期修稿日期(:2007.4.03)(:2007.5.05) 邮局订阅号元 年 - - : 82-946 360 /245 《P LC 技术应用 200 例》
本文档为【基于EMD法的语音信号特征提取】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_882336
暂无简介~
格式:doc
大小:104KB
软件:Word
页数:0
分类:生活休闲
上传时间:2017-10-01
浏览量:13