首页 基于依存语法的蒙古语语义角色分类及其标记研究

基于依存语法的蒙古语语义角色分类及其标记研究

举报
开通vip

基于依存语法的蒙古语语义角色分类及其标记研究基于依存语法的蒙古语语义角色分类及其标记研究 ,. 第卷第期 中文信息学报 ., 年月 文章编号:??? 基于依存语法的蒙古语语义角色分类及其标记研究 包晓荣,华沙宝,达胡白乙拉 内蒙古大学蒙古学学院,内蒙古呼和浩特 摘要:该文从蒙古文信息处理角度出发,着重参考了其他语言语义角色标注 的理论方法和蒙古语语义角色相关 研究成果,结合蒙古语依存句法树库的特征,通过手工标注分析研究,裁定了 基于依存语法的蒙古语语叉角色分类 及其标记。 关键词:蒙古语语料库;依存语法;语义角色 中图分类号: 文献标识...

基于依存语法的蒙古语语义角色分类及其标记研究
基于依存语法的蒙古语语义角色分类及其标记研究 ,. 第卷第期 中文信息学报 ., 年月 文章编号:??? 基于依存语法的蒙古语语义角色分类及其标记研究 包晓荣,华沙宝,达胡白乙拉 内蒙古大学蒙古学学院,内蒙古呼和浩特 摘要:该文从蒙古文信息处理角度出发,着重参考了其他语言语义角色标注 的理论方法和蒙古语语义角色相关 研究成果,结合蒙古语依存句法树库的特征,通过手工标注分析研究,裁定了 基于依存语法的蒙古语语叉角色分类 及其标记。 关键词:蒙古语语料库;依存语法;语义角色 中图分类号: 文献标识码:, , , ,, : , ? ? . . : ; ; 义角色标注,因此,它会促进机器学习研究的发展。 引言 在浅层语义分析的基础上,进行深层的语义分析将 成为未来研究的重点。 从语言信息处理整体的视角来看,语义角色标 蒙古文信息处理研究工作从世纪年代着 注是对自然语言理解的一个有益的探索。在自然语 手建立语料库开始,基本完成了字处理、词处理阶段 言理解系统中,不但要识别文本中的实体,而且还需 的工作,现在全面开展句子处理阶段的工作。语义 要做语义分析。语义分析是自然语言理解的根本性 分析是句子处理阶段的重要任务之一。 问题,也是自然语言处理的难点和热点问题。语义 从蒙古语信息处理的实际需求出发,为蒙古语 分析包括浅层语义分析和深层语义分析。 信息处理研究提供一个系统化、形式化的蒙古语语 语义角色标注是浅层语义分析的一种简化形式 义标注体系和一个规模相当的语义角色标注语料资 的实现方式,具有定义清晰、评测容易等特点,它是 源是蒙古语信息处理基础研究和应用研究的基础之 目前的研究热点。语义角色标注综合利用了分词、 一。建立蒙古语语义角色标注体系和蒙古语语义角 词性标注等底层的语言信息,以及高层的句法分析, 色标注语料资源是蒙古 文信息处理事业走向自然语 命名实体识别等信息,人们从这些信息中可以挖掘 言理解最终目标的必经之路,无论从理论意义还是 各种特征,再利用各种机器学习算法,做到自动的语 从应用需求来讲,它的研究价值都非常重要。 收稿日期:?一定稿日期:?? 基金项目:国家自然科学基金资助项目;内蒙古自治区高等学校青年科技英才支持 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 作者简介:包晓荣一,女,博士研究生,主要研究方向为蒙古文信息处理;华沙宝一,男,教授,博士生导师, 主要研究方向为蒙古文信息处理;达胡白乙拉一,男,博士,教授,硕士生导师,主要研究方向为蒙古文信息处理。 万方数据期 包晓荣等:基于依存语法的蒙古语语义角色分类及其标记研究 蒙古语浅层语义分析,是一项开拓性的研究工 点终点路径范围量幅 作。本工作不会仅仅停留在基础理论和方法论的抽 等个小类。 象层面上,而由它产生的标注语料资源和语义角色 语言都有共性,所以其他语言的语义角色分类 特征描述,将对多义词的语义识别、确定短语结构关 对我们制定基于依存于法的蒙古语语义角色分类有 很大的参考价值。 系、指定词语语义搭配提供有效的可操作信息,对开 发研制蒙古语信息检索、指代消解、机器翻译中的蒙 . 蒙古语语义角色分类及标记 古语语句自动分析和自动生成等应用系统都有直接 的应用价值。 蒙古语在传统研究和信息处理研究中,也注意 到了语义角色研究的必要性。蒙古语语义角色分类 及标记方面的研究有: 语义角色分类及标记相关研究 蒙古语传统研究进行句子研究和语义研究当中 . 注意到了语义角色研究的重要性。具有代表性的 其他语言语义角色分类及标记 有,宝?哈斯巴根提出的施事、当事等个类的 要进行语义角色标注,相应的标注体系是必需 分类,德力格尔玛提出的施事、受事等个分类, 的。在国内外众多相关研究项目中,都分别制定了 特图克提出的主体、受体等大类个小类的分 相应语言的语义角色标注体系。但是,由于各种语 类,其木格提出的主题格、客体格、领体格、工具格 言的情况不同,各个标注系统的出发点和着眼点不 等大类个小类。 同,各个语义角色标注系统所制定的标注体系也可 蒙古文信息处理工作进行句子分析和语义分析 和北京大学中文 以互不相同。下面比较 的时候注意到语义角色标注的重要性。从蒙古语信 网库的语义角色分类和标记。 息处理角度:额尔敦朝鲁口根据内蒙古大学编撰的 的语义角色是编了号的原型角色, 《蒙汉词典》,《蒙古语语法信息词典》以及万词 包 是中观层次上基于特定动词的角色。 级现代蒙古语语料库,对蒙古语动词做了语义分类, 括论元角色标注集和标注语料库。在 中 划分为个大类个小类。其中,根据动词的不 出现的语义角色分为核心论元和非核心论元两大 同特点,有些类细划分为层,有些划分为层,还 类。核心论元可分施事、受事、与事等多种论元,非 有划分为层的。海银花根据《蒙古语语法信息 核心论元又可以按照功能分出小类。具体来看,主 词典》的名词分库,对 条名词做了语义分类, 要有:,,,,,, 大体上分个大类,根据不同情况再细分,细分层次 ?,?,?,?? 最多有层。德?萨日娜妇根据对初中语文第一 ,?,,阱,? 册的分析,提出了一套蒙古语语义角色分类,第一层 ,,?,, 分个大类,第二层分个小类,第三层再分个 ?,?,?,? 细分类。富涛妇从万词规模的语料库抽取 ,?,等个小类。其中 个例句,经过实例分析,提出了一套针对蒙古 ?是核心论元,其他都属于非核心 语简单谓动句的语义角色分类,大体上分个层次, 论元‘?。 只是对第三层次的用具类和位置类进一步做了个 北京大学中文网库是汉语的真实文本上进行多 细分类和个细分类。 层次的语义关系标注的语料库。中文网库的语义 蒙古语语义角色分类和标记研究在传统语言学 角色是属于所谓中观层级的语义角色。北京大学中 和信息处理研究方面进行过,还取得一定的成果。 文网库的语义角色分为必有论元和非必有论元两大 但是,这些研究成果还存在一些问题。因为,有的分 类。必有论元再分.主体论元:施事感 类只是针对词的语义特征的而不是对句子语义单位 事经事致事主事;.客体 之间的语义关系的;有的虽然是针对语义角色的,但 论元:受事与事结果对象 依据的语料有一定的局限性或者针对的题材单一; 系事。非必有论元再分为.凭借论元: 语义角色的名称和种类不统一,命名过 于随意;划分 工具材料方式原因 颗粒度过分粗或者过分细,没有经过语义角色标注 目的。.环境论元:时间处所源 实际操作检验。关于蒙古语语义角色的研究 成果是 万方数据中文信息学报 记如表所示。 我们制定基于依存语法的语义角色分类的着重参 考点。 表 蒙古语语义角色分类及其标记 分类 细分类 标记代码 语义角色的蒙古语名称 基于依存语法的蒙古语语义角色分类及 施事 标记 当事主体 存在 . 蒙古语依存句法分析树库 主题 内蒙古大学在国家自然科学基金资助下构建了 受事 万词级的蒙古语依存句法分析树库。为建立该 客事 树库,借鉴了其他语言依存树库的成功经验,并针对 经事 蒙古语自身特点,把蒙古语语义关系分为大类,设 客体 立了包含种依存关系的蒙古语依存关系标记集, 与事 用有向弧表示从属词和支配词之间的依存关系,对 使动 句子的核心词以及上述种语义关系的标注和插 解释 入句的处理都给出了详细的标注规范,用了括弧形 时间式和树形形式两种标注形式引。 地点蒙古语依存关系标记集的规模和所包含的依存 方向 】 】 类型是合理的,它覆盖了蒙古语所有的依存现象,并 手段 且用该标记集标注的蒙古语依存句法分析树库包含了丰富的句法结构信息。 总的来说,蒙古语依存句 领体 依据 法分析树库的建立,对制定蒙古语语义角色标注体 原因 系和标注规范提供了重要参考依据,对建立蒙古语 目的 语义角色标注语料资源提供了可操作的基础条件。 状态 基于依存语法的语义角色标注方法是通过挖掘 范围 ? 句子中单词或短语之间存在的依存关系得出句子中 所属 成分的角色。蒙古语语义角色分类基于依存句法树 比喻 的话,不但可以利用单词之间的依存特征,而且也可 以预测与目标谓词有依存关系的短语为某种语义角 饰体 区别色。我们对一 定数量的标注依存关系的蒙古语语料 性质进行基于依存语法的蒙古语语义角色手工标注,分 数量析了依存关系和语义角色的对应关系。例如,依存 关系“”对应“施事”、“当事”、“存在”、“主题”等 其中,标记代码采用了语义角色蒙古语名称的 语义角色,有些被动句中对应“使动”的语义角色。 前三个字母,发生重复时从后续字母中选择一个合 适的字母,调整了代码标记的第三个位置。 .基于依存语法的蒙古语语义角色分类及标记 经过一定数量的蒙古语真实语料的验证,基于 基于依存语法的蒙古语语义角色标注研究中直 依存语法的蒙古语语义角色分类基本覆盖蒙古语语 接引用上述有关蒙古语语义的分类和标记仍然存在 义角色现象。这表明基于依存语法的蒙古语语义角 一定的问题。 色分类是合理的,科学的。 目前,我们对蒙古语依存句法分析树库的 标注依存关系的蒙古语语料库是进行语义角色 个句子进行语义角色手工标注实验,考虑基于依存 标注研究的语料资源,蒙古语依存句法分析树库有 语法语义角色的手工标注和自动标注,初步制定了 树形形式和文本形式,同样基于依存语法的蒙古语 包括主体、客体、领体、修饰大类,施事、当事等 语义角色标注也有树形形 式和文本形式。标记依存 个细分类的语义角色分类及标记。具体分类及其标 关系的蒙古语句子语料 上进行语义角色手工标注的 万方数据期 包晓荣等:基于依存语法的蒙古语语义角色分类及其标记研究 句子实例如下。 注:大写标记表示依存关系,小写标记表示语义 , 文本形式: 角色。 ,:一: 总括,本文从蒙古文信息处理的角度出发,对基 一:一:一: 于依存语法的 个蒙古语句子进行语义角色手 一:? 工标注,制定了蒙古语语义角色分类和标注体系。 ?一:一: 我们将以手工标注语料为基础,通过机器学习的方 ?一:一: 法,研制一个蒙古语语义角色自动标注系统,建立蒙 ,一:一 古语语义角色标注的语料资源。 :一:一: 一: 参考文献 一:一:? .??一:: .,,:?. 一:一:? 杨敏;常宝宝.基于北京大学中文网库的语义角色分类 一:一:? ;.中文信息学报,,;. ?一:一: 袁毓林.语义角色的精细等级及其在信息处理中的应 ?一:? 用;.中文信息学报,,:?. 一:一: 宝哈斯巴根.现代蒙古语动词研究.北京:民族出 版社,. 。一我以庄重的姿态带 德力格尔玛.蒙古语语义研究.沈阳:辽宁民族出 着两个姑娘和女婿,仰望着往衣着破旧的年迈水手 版社,。 走过去的父亲的背影留下了。 特图克.蒙古语句子语义学结构;.中国蒙古学, 注:括弧内是蒙古语拉丁转写和汉语翻译。 ,:. 单词后面第一个括弧内的标记表示依存关系, 其木格.蒙汉语常用语义格对比研究.中央民族大 第二个括弧内的标记表示语义角色。 学:中央民族大学硕士学位论文,. 额尔敦朝鲁.面向信息处理的蒙古语动词语义研究 树形形式: 。内蒙古大学:内蒙古大学博士学位论文,. 海银华.面向信息处理的蒙古语名词语义研究.内 蒙古大学:内蒙古大学博士学位论文,. ;萨日娜.蒙古语格框架的研究.内蒙古大学:内 蒙古大学博士学位论文,. 王步康,王红玲,袁晓虹,等.基于依存句法分析的语 义角色标注.中文信息学报,,:?. 富涛.面向信息处理的蒙古语简单句谓动句句模研究 ;.内蒙古大学:内蒙古大学博士学位论文,. 冯文贺;姬东鸿.命题库:分析与展望.外语电化 教学,,:?. 斯?劳格劳.现代蒙古与依存句法自动分析研究 。内蒙古大学博士学位论文,. ? 专荤 ‘ 图蒙古语语义角色标注实例 万方数据
本文档为【基于依存语法的蒙古语语义角色分类及其标记研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_212655
暂无简介~
格式:doc
大小:27KB
软件:Word
页数:0
分类:工学
上传时间:2017-11-14
浏览量:23