下载

0下载券

加入VIP
  • 专属下载券
  • 上传内容扩展
  • 资料优先审核
  • 免费资料无限下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 一种新的语声模型 汉字系统的标准音程

一种新的语声模型 汉字系统的标准音程.doc

一种新的语声模型 汉字系统的标准音程

liu亚杰
2017-12-20 0人阅读 举报 0 0 0 暂无简介

简介:本文档为《一种新的语声模型 汉字系统的标准音程doc》,可适用于影视/动漫领域

一种新的语声模型汉字系统的标准音程一种新的语声模型汉字系统的标准音程一种新的语声模型汉字系统的标准音程六吋大脚引言有人问:第五代计算机为什么没能出现因为它在处理人的自然语言的问题上出现了困难。也就是说要让机器理解人的语言并自己说出人的语言(不是录音)的问题上,计算机学家还找不到"人的感觉"。正如瑞典的语言学家GFant所说"我想说的是我们对语言代码的认识仍是很贫乏的。我们需要的是第五代语言学家而不是第五代计算机。"从技术角度讲,因为目前的计算机语音识别模式仍然是基于经验统计的模型匹配。而由于相关模型的先天不足使得相应的匹配技术必需依赖于特大的计算量从而使方法成了语音识别的技术瓶颈。应该探讨新的语音模式汉字的标准音程表。一汉语音程的概念懂乐理的人都知道什么叫做音程简单地可理解为"两个音高的频率差"。音乐中的每个音与其它音之间的"音高差"都是固定的。所谓的十二平均律就是将八度音程分成十二个均等的部分即半音音程的音律。物理上则将八度的音程称做倍频程。表为FF=^(注:F与F为两个相互比较的纯音的频率。)设FF=^那么这个十二分之一倍频程就是前述"将八度音程分成十二个均等的部分"的物理意义注意所述音的频率是指基频即真实的声音(复合音)中最低的频率成份。而十二平均律中的每个音的频率(即纯音音高)都是固定的。有了十二平均律将其中不同的音按照音乐家的想象作出不同的组合并配以节奏的分割就成了优美的乐曲了。不过乐曲好不好听从物理学的角度就是要保证发音物体能准确地发出每个音的频率这就叫做音准。曾有人嫉妒小提琴国手盛中国就说他的音准不够。可见这个音准即每个乐音的频率是否符合十二平均律的规定是评价音乐表达的一个重要指标以后还要专门讨论它。那么汉字系统是否也应该存在相应的"N倍频程"即"N平均律"呢从以上关于倍频程的讨论可知那是完全可以肯定的。至于这个N取什么值(最大值)则需要一定的实验数据来支持了。例如设N=参照十二平均律的频率分布可以得出相对的二十四律的分布频率值。见下表:频率音名C#CD#DEF#FG#GA#AB频率音程有了这个表将新华字典里的汉字按第一声的读音实验给出的频率将它们归位就可以了。当然我们现在就可以把"多夺朵舵"等字都放到N=部而把"来赖"(第一和第三声空缺)放到N=部把"咪迷米密"归入N=部把"发罚法发"等字都放到N=部…把"西席喜戏"放到N=部。可惜普通音阶只有七个音可供汉字准确归位其它字音就要通过实验来对应给出了。然而汉字还有所谓的四声。其物理意义为:具有相同起点基频(即相同音韵)的字被赋予不同的基频走向(平仄四声)从而成了不同的字可称为同韵字而具有相同基频起点及其走向的字就是同音字了。此表是按N=来计算给出的。但如果穷尽声、韵母的组合则有七百多种(不计四声)而事实上只应用到了种(以新华字典为准)。假定这种字音的音高是等程分布的那么按照十二平均律则在每个半音音阶之间将分布有个不同音高的字类而依上述律则每个相邻音的音注:所述字类定义为声韵母均相同的字程中也将要容纳个不同音的字类。(的总体。)由此可见仅以律作为字音划分的标准是非常粗糙的对于机器识别可能远远不够。从纯技术的角度讲显然是分得越细越好。也就是说应当尽可能地使频率的划分作到一字一音例如取N=这对机器而言轻而易举。虽然对于完全同音字尚无能为力但也还可从其它特怔来加以区分。如果只讨论一般的语音现象比如押韵那么处于律的相邻音的音程内的字可能就已足够"押韵"了。二实验设计空缺中。预计在年月某日可能到位。实际上这样的"标准"理应由权威部门颁布为宜。是盼。三汉字标准音程表的意义以上的讨论可知按律的划分则每个相邻音的音程中也将要容纳个不同音的字类。从听觉上讲也许这个字听上去已经很相似了呢即所谓的押韵。而对其它性质的研究则可与成熟的音乐理论进行科学类比以便更全面地理解汉字标准音程表的意义。这里主要表现在以下几个方面:、音准。前已叙及音准是考查音乐表达的一个重要指标。从物理学上讲每个乐音都含有丰富的谐波成份即以不同倍频的音波共同构成复合音。不同的发声物体其基波与谐波的物理参数构成是不同的而这些特殊的构成就表现为不同的音色。在乐理中把所述谐波称为泛音泛音是决定音乐色彩的独一无二的指标具有不可替代性。就象说彭丽媛不能代替宋祖英一样。显然如果基音不准其相应的不同倍频的泛音也就不同所要表达的乐思也就出现了偏差。俗话说"五音不全"指的就是音准欠佳。如果我们能够准确地按上述汉字标准音程表来说话就如同在舞台上表演话剧一样了那么说起来就会象唱歌似地好听。所谓"说得比唱的还好听"其物理意义大概就在于此。而俗话讲"尽拣好听的说"大概是指当我们在写诗歌或抒情散文时要尽量地选取那些位于前述"标准八度音"的字来组词这样一来诗歌的字词本身就是标准的音乐旋律于是说话就跟唱歌一样、调性。利用五线谱来定音阶就可给出标准音阶。其具体的音名为C、了。D、E、F、G、A、B。其中EF之间、BC之间都是半度音程。若将其中的某个音名定为主音那么曲调就称为该音名的调性。例如F调就是在标准音阶的排列中取F音为简谱中的于是G=A=#A=C=D=E=…那么,汉字的语音是否也有类似的"调性"呢从以上的讨论可知当然是有的只不过其相应的所谓"调性音阶"同样是"五音不全"罢了。例如领导在台上作报告语调就比较高亢而台下的员工们讲话语调就比较低沉那是因为各人所处的环境位置不同决定其所采用的调性不同所致。、基于汉字标准音程表的语音识别与摸拟前面所谈的都还只是现实中的语言现象及其应用。而我们最关心的当然是计算机的应用了但这已超出本文所要讨论的范畴。致力于机器语音应用研究的计算机工程师们将不难发现此语言模式的价值可据此构造更为简明的识别与模拟的机器模式。更具体地说从当时调性、个人失真八度等方面入手结合现有的一些成熟技术建立与标准音程的对比模式及其相关算法将给出一条简捷可靠的实行路径。尾声此文仅在此抛砖引玉~毕竟与文字有关也算是对原创文学的一种支持。

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

评分:

/4

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利