首页 基于文献挖掘的蛋白质相互作用信息数据库设计及实现

基于文献挖掘的蛋白质相互作用信息数据库设计及实现

举报
开通vip

基于文献挖掘的蛋白质相互作用信息数据库设计及实现 基于文献挖掘的蛋白质相互作用信息数据库设计及实现 李满生,马 洁,杨春媛,朱云平 [摘要] 目的 针对目前数据库在提供组织、存储和展示文献来源的蛋白质相互作用知识和数据支撑方面的不 足,设计并构建了蛋白质相互作用信息数据库系统(protein-protein interaction information database,dbPPII)。方法 根据文献来源的蛋白质相互作用数据的特点,使用 MySQL设计包含蛋白质相互作用、文献及本体三方面信息的数 据库结构,引入本体工具展示数据,并使用 JSP等技术开发实现...

基于文献挖掘的蛋白质相互作用信息数据库设计及实现
基于文献挖掘的蛋白质相互作用信息数据库设计及实现 李满生,马 洁,杨春媛,朱云平 [摘要] 目的 针对目前数据库在提供组织、存储和展示文献来源的蛋白质相互作用知识和数据支撑方面的不 足,设计并构建了蛋白质相互作用信息数据库系统(protein-protein interaction information database,dbPPII)。方法 根据文献来源的蛋白质相互作用数据的特点,使用 MySQL设计包含蛋白质相互作用、文献及本体三方面信息的数 据库结构,引入本体工具展示数据,并使用 JSP等技术开发实现。结果 数据库系统实现了基于本体的信息组织 和展示,提供多种数据查询方式及丰富的文献信息,并具有数据下载功能。目前,dbPPII 系统已经应用于组织、存 储和展示人及小鼠肝脏相关文献挖掘得到的蛋白质相互作用信息。结论 dbPPII 系统具有存储和检索文献来源 的蛋白质相互作用信息的多种优势,并有效地利用了蛋白质相互作用本体信息框架组织和展示蛋白质相互作用数 据。dbPPII访问主页:http:/ /ppii. hupo. org. cn。 [关键词] 蛋白质相互作用;文献挖掘;蛋白质相互作用注释信息;蛋白质相互作用本体 [中图分类号] Q51 [文献标志码] A [文章编号] 1674-9960(2013)12-0922-06 DOI:10. 7644 / j. issn. 1674-9960. 2013. 12. 011 Literature mining-based protein-protein interaction information database:design and implementation LI Man-sheng,MA Jie,YANG Chun-yuan,ZHU Yun-ping* (Beijing Institute of Radiation Medicine,State Key Laboratory of Proteomics,Beijing Proteome Research Center,Beijing 102206,China) * Corresponding author,Tel:010-80705225,E-mail:zhuyunping@ gmail. com [Abstract] Objective To design and construct a protein-protein interaction information database (dbPPII)in order to improve the organization,storage and display of important literature. Methods According to the characters of literature- derived PPIs and their annotation,the database structure which included the information of PPIs,literature and ontology was designed using MySQL. The ontology tool was used to display PPI data and JSP technology was employed to implement the database system. Results dbPPII was able to organize and display PPI information based on the novel PPI information scheme (PPI ontology PPIO). It provided multiple query methods and enriched literature information of PPIs to facilitate research. dbPPII was now applied to store and display the PPI information extracted from human and mouse liver related literature. Conclusion dbPPII has many advantages in storing and querying literature-derived PPI information and also successfully uses the PPIO to organize and display PPI data. dbPPII is accessible at:http:/ /ppii. hupo. org. cn. [Key words] protein-protein interaction;literature mining;PPI annotation;PPI ontology [基金项目] 国家重点基础研究发展 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 (973)资助项目(2011CB910601, 2010CB912700);国家高技术研究发展计划 (863)资助项目 (2012AA020201,2012AA020409)和国家自然科学基金资助项目 (21275160) [作者简介] 李满生,男,博士研究生,研究方向为生物信息学,E- mail:limansheng@ gmail. com [作者单位] 北京放射与辐射医学研究所,蛋白质组学国家重点实 验室,北京蛋白质组研究中心,北京 102206 [通讯作者] 朱云平,Tel:010-80705225,E-mail:zhuyunping @ gmail. com 蛋白质相互作用(protein-protein interactions, PPI)作为生命活动中一类极其重要的生物分子事 件,其研究不仅可以揭示生命活动的基本规律,还在 发掘病理机制及药物开发方面具有重大的应用价 值。因此,研究 PPI越来越受到人们的重视,成为研 究蛋白质功能的重要方面之一。蛋白质是细胞生命 活动的载体和细胞功能的主要执行者,从遗传物质 复制到基因表达调控,从细胞信号转导到新陈代谢, 从细胞增殖到细胞凋亡,这些生命活动都是蛋白质 之间相互作用、相互影响的结果[1]。为满足 PPI 研 究的需求,人们建立了诸多储存 PPI信息的数据库, 目前数量已达 79 个[2,3]。这些数据库的数据主要 来自高通量实验和计算方法预测结果。 随着 PPI研究工作的开展与深入,报道各类 PPI 的文献数量也在不断增加。这些文献不仅描述了哪 些蛋白质间发生了相互作用,还阐明了作用的方式、 229 军事医学 2013 年 12 月 第 37 卷 第 12 期 Mil Med Sci,Vol 37,No 12,Dec,2013 蛋白质的状态。作用的时间和空间等注释信息,如 在哪些生物学过程(biological process)中、在哪些亚 细胞定位(subcellular location)上发生以及发生相互 作用后产生了什么样的生物学功能(biological func- tion)[4]。这些信息是研究人员深入理解蛋白质间 的相互关系,并进一步构建蛋白质相互作用网络、描 绘生物学通路的关键。 目前生物医学文献数目巨大且增长迅速,通过 人工阅读整理文献已经难以及时、高效地挖掘和整 合其中的 PPI 信息。文献挖掘(literature mining)方 法是解决这类“信息爆炸”问题的一种有效途径[5]。 文献挖掘方法已随着自然语言处理(natural lan- guage processing)技术的发展而获得了良好的应用 性能,可以比较准确快速地获得 PPI及其注释信息。 这些方法的相应工具极大地提高了研究人员获取蛋 白质的相互作用相关信息的效率[6,7]。另一方面, 高通量实验以及计算方法预测所得到相互作用假阳 性率较高[8],而且相当一部分没有注释信息或者注 释不充分,对于理解相互作用机制远远不够。所以 文献挖掘方法比高通量实验和计算预测方法获得的 信息更全面,更有“源”可寻、有“据”可依。基于文 献挖掘方法得到的 PPI数据逐渐成为一类十分重要 的信息资源[9 ~ 11]。然而,现有的 PPI 数据库的数据 框架主要是针对实验方法和预测方法相关信息的需 求而设计,数据库结构本身并不适合组织和存储文 献来源的 PPI信息,因此亟需设计和开发与之相适 应的数据库系统。 本体(ontology)是指一种标准化的、对于共享概 念体系的明确而又详细的说明。狭义的本体(领域 本体)表现为一组与领域知识相关的受控词表(con- trol vocabulary,CV),该组词表描述了特定领域中存 在的对象或概念及其属性和相互关系。作为某一领 域知识的表达模型,本体一方面可以作为该领域数 据注释的标准,另一方面可以利用其层次结构,对该 领域数据进行组织和分类。近年来,生物医学领域 建立了以基因本体(gene ontology,GO)[12]为代表的 多种生物医学本体,并被广泛应用于各类生物数据 库的数据注释、数据组织、数据展示以及数据查询当 中。GO提供了一组描述真核生物基因 /蛋白质功 能信息的受控词表,该受控词表包含 3 个方面 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 : 生物学过程(biological process)、细胞组分(cellular component)和分子功能(molecular function)。目前, GO的一个重要应用是基因本体注释(gene ontology annotation,GOA)计划[13,14],该计划的主要目的是把 所有已测定基因归入 GO 框架之中。在 GOA 计划 中,GO 还被应用于注释 SWISS-PROT,TrEMBL 和 Ensembl等非冗余数据库蛋白质的功能。通过 GO 的知识体系,研究人员可以获得基因 /蛋白质的时间 (生物学过程)和空间(细胞组分)等功能注释信息, 因此 GO得到生物信息领域的广泛采纳和高度认 同。目前,PPI 数据库主要采用蛋白质组学标准倡 议———分子相互作用(proteomics standards initiative- molecular interaction,PSI-MI)[15,16]受控词表注释数 据,该受控词表侧重于 PPI实验信息的描述,为实验 来源的 PPI 数据提供了较好的注释框架[17,18]。然 而 PSI-MI缺乏 PPI时间及空间方面的词汇,并不适 合用于组织文献来源的 PPI 数据。而如前所述,GO 包括了丰富的生物学过程,细胞组分和分子功能的 词汇。这套描述基因 /蛋白质时空信息的框架也为 PPI知识的表示提供了丰富的术语资源[19,20],因而 GO在挖掘、组织和展示文献来源的 PPI注释信息方 面具有巨大的应用潜力。 综上,虽然目前存在数目众多的 PPI数据库,但 是存在数据框架和数据标准的偏向性,不能满足文 献来源的 PPI信息的存储、组织与展示。所以,面对 从海量生物医学文献挖掘获得的丰富的 PPI 信息, 需要采用相应的信息注释框架和研发相应的数据库 结构,对所获得的 PPI关系、 句子 关于阅读的唯美句子关于古风的唯美句子执行力的经典句子鼓励人努力奋斗的句子用沉默代替一切的句子 信息以及注释信息 进行存储、组织和利用。基于此种情况,我们设计并 构建了 PPI信息数据库系统(protein-protein interac- tion information database,dbPPII),同时利用 GO 在 组织文献来源的 PPI 信息上的优势,开发了一个整 合了 GO的 PPI信息注释框架———蛋白质相互作用 本体(protein-protein interaction ontology,PPIO)(ht- tp:/ /ppio. hupo. org. cn)来组织和展示 PPI 信息,为 研究者有效存储和利用这类信息提供方便。同时, 我们将本系统应用于存储从人和小鼠肝脏相关文献 中挖掘得到的 PPI 信息,验证了本数据库系统的实 际应用性。 本文阐述了当前 PPI数据库的结构及注释标准 在组织和存储文献来源的 PPI信息方面存在的不足 和相应的解决 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ;其次介绍了 PPI 信息数据库系 统的数据结构设计和实现技术,描述了数据库收录 的 PPI数据的文献挖掘过程。在结果部分说明了本 数据库系统的信息查询方式及数据展示功能,讨论 了本数据库系统较现有数据库在数据组织、数据查 询和数据展示方面所具有的优势及其潜在的应用价 值。最后,展望了本数据库系统未来的发展方向。 1 材料与方法 1. 1 数据库结构设计及本体框架 根据 PPI关系,文献数据及本体结构,设计关系 329军事医学 2013 年 12 月 第 37 卷 第 12 期 Mil Med Sci,Vol 37,No 12,Dec,2013 数据库系统对这些信息进行结构化存储与展示。系 统框架主要包括:①多样化信息查询方式模块;②数 据展示模块,包括查询结果视图及本体浏览结果视 图;③数据存储模块。系统采用浏览器 /服务器 (browser / server,B /S)结构。使用了 MySQL Work- bench 5. 1 OSS 设计数据库的数据模型———实体关 系(entity-relation,ER)模型。本数据库所采用的 PPIO框架共整合了围绕 PPI 事件 6 个方面的属性 信息:蛋白质角色和状态(who)、生物学过程 (when)、亚细胞定位(where)、生物学功能(what)、 相互作用方式(how)以及相互作用检测方法 (which)。描述这些方面信息的词汇来自 GO、PSI- MI、PSI-MOD(protein-modification)[21]、系统生物学 本体 (systems biology ontology,SBO)[22]和基因调节 本体(gene regulation ontology,GRO)[23]等生物医学 本体。 1. 2 数据集及数据处理 1. 2. 1 文献获取及预处理 本系统的实验数据为 人和小鼠肝脏蛋白质相关的生物医学文献,其中人 类肝脏蛋白质相关文献摘要 153 465 篇(以“human AND liver AND protein”为关键词通过 PubMed 的网 络服务 API———eUtils[24]获取,下载日期 2012-02)。 小鼠肝脏相关文献摘要 47 875 篇(以“mouse AND liver AND protein”为关键词从文献数据库 PubMed 中获取,下载日期 2012-01)。获取的文献数据均为 XML格式,通过 XML解析程序提取出文章标题、摘 要等数据,为进一步挖掘 PPI信息做准备。 1. 2. 2 PPI关系及注释信息挖掘 PPI 信息提取流 程为:首先,将获取的文献摘要进行分句处理;其次, 使用 ABNER[25]工具识别句子中的蛋白质名称并筛 选出含有两个蛋白质名称以上的句子;第三,采用支 持向量机(support vector machine,SVM)方法[26]来 挖掘文献中的 PPI 关系。该 SVM 方法使用了 LLL05 语料[27]进行训练和测试,词特征、词性特征、 逻辑特征和句法(syntax)特征被用作句子中 PPI 关 系的表示特征。该方法最终得到了 82. 4%准确率, 73. 7%召回率和 77. 8% F 值。SVM 方法的具体构 建步骤详见文献[26]。从句子中提取以上提及的 特征集,构建符合 SVM模型的特征矩阵并使用训练 好的 SVM 分类模型进行判断,获取 PPI 关系。最 后,使用 PPI本体受控词表为词典(共 2577 个术语, 2951个术语同义词),从含有 PPI 关系的句子中识别 相应的注释信息。整个数据处理流程如图 1所示。 图 1 人及小鼠肝脏 PPI信息的文献挖掘流程 1. 3 系统开发及运行环境 1. 3. 1 开发技术及环境 dbPPII 系统的架构和数 据库结构分别使用 Microsoft Visio 2007 和 MySQL Workbench 5. 1 OSS 进行设计。系统采用 JSP(Java server pages)技术、JDBC(Java DataBase connectivity) 技术、J2EE(Java 2 platform,enterprise edition)中常 用的 SSH(struct,spring,hibernate)框架和 MySQL 数据库管理系统实现。系统在 MyEclipse 6. 5 集成 开发环境下完成,遵循模型—视图—控制(model- view-control,MVC)设计模式,并在网页浏览器 In- ternet Explorer 8 上通过测试。 1. 3. 2 部署及运行环境 dbPPII 系统部署的服务 器为Windows 2003 操作系统,使用 Tomcat 5. 5 应用 服务器。系统后台数据库管理系统采用 MySQL Server 5. 5。 2 结果 2. 1 数据统计 dbPPII包含的数据类型包括文献、PPI 关系及 PPI注释信息,另外还有 PPI与文献之间、PPI与 PPI 注释信息之间对应关系。表 1 为 dbPPII 中各类数 据的统计信息。 429 军事医学 2013 年 12 月 第 37 卷 第 12 期 Mil Med Sci,Vol 37,No 12,Dec,2013 表 1 数据库中人与小鼠主要数据类型及其数量 数据类型 人 小鼠 文献摘要 153 465 47 875 含 PPI句子 91 062 31 895 蛋白质* 75 079 38 424 PPI 107 907 51 568 含生物学过程的相互作用 58 551 16 955 含亚细胞定位的相互作用 15 881 6443 含生物学功能的相互作用 27 313 6997 * 蛋白质名称的数目,若文献中对同一蛋白质使用了不同名称, 则数目累加 2. 2 数据库结构 dbPPII的实体关系模型如图 2 所示,共包括 9 个数据 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 :蛋白质信息表(TBLPROTEIN)、PPI 关 系表(TBLPROTEINREL)、文献信息表(TBLARTI- CAL)、文献句子信息表(TBLSENTENCE)、PPI本体 术语表(TERM)、术语关系表(RELATIONSHIP)、术 语关系类型表(TYPE _DEF)、PPI 与句子关联表 (REL2SENTENCE)以及 PPI 与注释信息关联表 (REL2ANNO)。这些表格分为 3 部分:文献数据存 储(图 2A)、PPI 数据存储(图 2B)和 PPI 本体数据 存储(图 2C)。TBLPROTEIN 描述了蛋白质实体及 其属性,包括蛋白质 ID、蛋白质名称、蛋白质名称缩 写、物种 ID、物种名称、物种简称及蛋白质参考数据 库信息。PPI(TBLPROTEINREL)存储 PPI 关系 ID、 参与相互作用的蛋白质 ID及 PPI参考数据库信息。 TBLARTICAL包含了文献 ID (即在 PubMed 数据库 中的 PMID)、标题、作者、期刊、发表年份、期刊类 型、摘要和关键词等。存储本体数据的几个相关表 格———TERM、RELATIONSHIP 和术语关系类型表 (TYPE_DEF)包括了术语的名称、命名空间、术语间 的关系和关系类型名称等。 图 2 数据库实体关系(entity-relation,ER)模型 A.文献信息数据表 ER图;B. PPI关系存储数据表 ER图;C. PPI存储数据表 ER图;每张表格描述一个信息实体,表格间的连线描 述实体之间的关系 2. 3 系统功能 2. 3. 1 数据检索 PPI信息数据库系统在主页界面提供了统一的 信息查询框,通过这个查询框及下拉菜单,用户可以 快速获取人或小鼠 PPI信息。除统一的信息查询框 外,dbPPII还在查询界面提供了 3 类查询方式来检 索数据库中的数据。 (1)蛋白质名称查询:通过输入蛋白质名称,可 以得到包含该 PPI 信息,并展现以这个蛋白质为中 心的相互作用集,以及该蛋白质与其他蛋白质在不 同生物学过程、亚细胞定位中的相互作用和完成生 物学功能等信息。 529军事医学 2013 年 12 月 第 37 卷 第 12 期 Mil Med Sci,Vol 37,No 12,Dec,2013 (2)基于本体术语查询:基于本体的查询有两 种方式,一是直接输入本体术语名称,二是点击树状 本体中的词条。基于本体的查询可以从整体上垂直 搜索和浏览 PPI信息。 (3)PPI查询:PPI查询方式允许用户通过输入一 对蛋白质的名称进行查询,从而可以让用户直接得到 关注的 PPI及相关的功能注释和参考文献等信息。 2. 3. 2 数据展示 (1)用户查询视图:从蛋白质名称、本体术语及 PPI查询的结果中,用户可以看到与查询术语相关 的 PPI及其注释信息(生物学过程、生物学功能和亚 细胞定位)。通过点击 PPI 的 ID,还可以得到对该 PPI更详细的注释信息,如蛋白质的状态、相互作用 类型、检测方法和参考文献句子等。另外,通过句子 的链接,用户还能进一步获得整篇文献的信息。 (2)本体浏览视图:系统使用了本体层次结构 作为浏览 PPI 信息的全局视图。PPIO 从生物学过 程、亚细胞定位、生物学功能、相互作用方式、蛋白质 角色与状态和 PPI检测方法 6 个方面对 PPI 数据进 行组织。通过这样的方式,用户可以对 PPI 网络进 行功能模块性划分,找到 PPI 网络中特定功能的模 块子网。 3 讨论 根据文献挖掘来源的 PPI 信息而设计,并采用 PPIO为数据组织框架实现的 dbPPII 系统具有以下 4 个方面的特点。 (1)检索功能的全面性:相对于目前大多数据 库仅提供基于蛋白质的查询方式,本数据库系统提 供了基于蛋白质、本体术语及 PPI 3 种信息查询方 式。基于蛋白质名称或 ID 查询是一个基本的查询 功能,研究人员可由此获得关注的蛋白质相关相互 作用数据。基于本体术语查询可以满足研究人员获 取与某类生物学过程、某个细胞位置或某种生物学 功能相关的 PPI信息的要求。而基于 PPI 查询则可 以直接定位 PPI,快速获得与目标相互作用相关的 功能注释信息及文献信息。因此,dbPPII 系统实现 了多样的、全面的信息检索功能。 (2)基于本体的数据组织和展示的优越性:由 于本体在数据的注释、共享、组织和展示方面都有良 好应用,因而采用 PPI本体为组织框架的 dbPPII 系 统具有众多的优点。第一,本体是一个层次化结构 的叙词表,根据 PPI本体对 PPI进行数据分类,得到 PPI信息的全局视图,能够对 PPI 数据进行垂直检 索,让用户按照功能分类快速地找到相应的 PPI。 与此形成对比的是,现有 PPI 数据库虽然广泛采用 PSI-MI数据标准,但是并没有给出一个基于 PSI-MI 的直观层次视图。第二,通过对不同功能的 PPI 进 行分组、统计,可以获得不同功能层次上的 PPI 分 布。功能分布由平面分布转化为层次分布,便于构 建 PPI的功能子网络。第三,PPI本体为 PPI功能注 释信息提供了受控词汇,有助于实现文献来源的 PPI数据进行标准化的注释、格式整理和数据整合。 (3)数据库系统结构的合理性和可扩展性:一 方面,本数据库系统的信息表结构包括三大部 分———文献信息表,PPI 关系信息表及 PPI 注释信 息表,故能有效存储文献来源的相应信息。同时,蛋 白质信息表和 PPI 关系表均设有来源数据库的字 段,可与来源数据库进行关联。另一方面,系统中数 据表格的字段设计具有物种普适性,而非仅仅针对 人和小鼠两个物种的 PPI 信息。因此,dbPPII 系统 可以存储其他任何物种相关文献挖掘得到的 PPI信 息,具有良好的可扩展性。 (4)数据库系统的潜在应用价值:首先,在数据 库中的每一对相互作用都有对应的文献信息,通过 相关文献句子的阅读,可加深对 PPI的理解。其次, 通过对文献中的 PPI 信息进行收集和整合,可以揭 示潜在的生物分子通路。如已知蛋白质 A 和 B、蛋 白质 C和 D分别发生相互作用,若能从文献中得到 蛋白质 B 和 C 也在相同的生物学过程和细胞位置 发生相互作用的支持,则提示“A—B—C—D”可能 为一条新的通路。第三,通过搜索蛋白质、生物学过 程、亚细胞定位或生物学功能,可以获得相应的 PPI,通过连线(link)的叠加,从而构建以某个蛋白 质为中心的相互作用网络或某一类 PPI 功能子网。 获得 PPI网络后,可以根据结点连接度等拓扑结构 信息挑选重要蛋白质,为研究对象的筛选提供重要 参考依据。最后,通过搜索人和小鼠的同源蛋白质、 相同的生物学过程、亚细胞定位或生物学功能相关 的蛋白质,可以构建并比较两个物种间的同一类 PPI子网,从而发现相同功能的实现机制在不同物 种上的差异,实现信息的互补。数据库系统整合丰 富的文献来源的 PPI 信息,使得研究人员可以从不 同的系统尺度上挖掘 PPI 的信息,得到分散的 PPI 数据难以呈现的认知。 鉴于现有 PPI数据库在存储文献来源的 PPI 信 息时,在数据结构、数据注释标准以及数据的查询与 展示等方面存在的不足,我们设计并实现了 dbPPII 系统。该数据库具有整合和存储文献来源的 PPI数 据信息的多种优势,并成功将本体工具引入了 PPI 信息的组织和展示。该数据库系统实现了多样化信 息查询、信息展示和数据下载功能。其中多种信息 629 军事医学 2013 年 12 月 第 37 卷 第 12 期 Mil Med Sci,Vol 37,No 12,Dec,2013 查询方式及本体浏览功能更好地实现了对 PPI详细 信息的有效获取。对人和小鼠肝脏相关文献挖掘得 到的 PPI信息的有效整理,证明了 dbPPII 系统适用 于对文献来源的 PPI信息的存储,组织及展示。 在下一步对 dbPPII系统的维护及升级工作中, 我们将主要关注以下 4 个方面:①数据的实时更新 与扩展;②基因 /蛋白质名称的标准化(gene /protein name normalization)[28]和与权威数据库之间的数据 关联;③PPI的网络可视化;④深度挖掘和整合数据 库中的 PPI信息。首先,数据维护是每个数据库系 统都会面临的重要问题,dbPPII 系统也不例外。随 着蛋白质功能研究 的发展很生物医学文献的更新, 我们将添加更多物种、器官、组织甚至细胞类型相关 的文献挖掘得到的 PPI 信息。同时,dbPPII 系统功 能还需要不断丰富和完善,如与国际权威数据库进 行数据关联、PPI 数据网络可视化等。另外,dbPPII 系统已经收集了丰富的肝脏 PPI 信息,基于这些数 据展开深度的挖掘和整合,有望实现知识再发现和 知识应用。 【参考文献】 [1] Gavin AC,Maeda K,Kühner S. Recent advances in charting protein-protein interaction:mass spectrometry-based approaches [J]. Curr Opinion Biotechnol,2011,22(1):42 - 49. [2] Bader G,Cary M,Sander C. Pathguide:a pathway resource list [J]. Nucleic Acids Res,2006,34(Database Issue):D504. [3] Klingstrm T,Plewczynski D. Protein-protein interaction and pathway databases,a graphical review[J]. Brief Bioinformatics, 2011,12(6):702 - 713. [4] 余鑫煜,许正平. 蛋白质相互作用数据库及其应用[J]. 中 国生物化学与分子生物学报,2008,24(3):189 - 196. [5] Hakenberg J,Nenadic G,Rebholz-Schuhmann D,et al. Litera- ture mining solutions for life science research[J]. Adv Bioinfor- matics,2013:320436. [6] Arighi CN,Carterette B,Cohen KB,et al. An overview of the BioCreative 2012 Workshop Track Ⅲ:interactive text mining task[J]. Database,2013:bas056. [7] Li C,Jimeno-Yepes A,Arregui M,et al. PCorral-interactive mining of protein interactions from MEDLINE[J]. Database:the journal of biological databases and curation,2013:bat030. [8] Montanez G,Cho YR. Predicting false positives of protein-pro- tein interaction data by semantic similarity measures[J]. Cur Bioinformatics,2013,8(3):339 - 346. [9] Chatr-aryamontri A,Breitkreutz BJ,Heinicke S,et al. The Bio- GRID interaction database:2013 update[J]. Nucleic Acids Res,2013,41(D1):D816 - D823. [10] Licata L,Briganti L,Peluso D,et al. MINT,the molecular in- teraction database:2012 update[J]. Nucleic Acids Res,2012, 40(D1):D857 - D861. [11] Kerrien S,Aranda B,Breuza L,et al. The IntAct molecular in- teraction database in 2012[J]. Nucleic acids Res,2012,40 (D1):D841 - D846. [12] Ashburner M,Ball CA,Blake JA,et al. Gene ontology:tool for the unification of biology[J]. Nat Genet,2000,25(1):25 - 29. [13] Camon E,Magrane M,Barrell D,et al. The gene ontology anno- tation (GOA)project:implementation of GO in SWISS-PROT, TrEMBL,and InterPro[J]. Genome Res,2003,13(4):662. [14] Barrell D,Dimmer E,Huntley R,et al. The GOA database in 2009--an integrated gene ontology annotation resource[J]. Nu- cleic Acids Res,2009,37(Database issue):D396. [15] Hermjakob H,Montecchi-Palazzi L,Bader G,et al. The HUPO PSI's molecular interaction format-a community standard for the representation of protein interaction data[J]. Nature Biotechnol, 2004,22(2):177 - 183. [16] Kerrien S,Orchard S,Montecchi-Palazzi L,et al. Broadening the horizon-level 2. 5 of the HUPO-RPSI format for molecular in- teractions[J]. BMC Biol,2007,5(1):44. [17] Orchard S. Molecular interaction databases[J]. Proteomics, 2012,12(10):1656 - 1662. [18] Orchard S,Kerrien S,Abbani S,et al. Protein interaction data curation:the International Molecular Exchange (IMEx)consorti- um[J]. Nat Methods,2012,9(4):345 - 350. [19] Chen G,Li J,Wang J. Evaluation of gene ontology semantic similarities on protein interaction datasets[J]. Int J Bioinformat- ics Res Appl,2013,9(2):173 - 183. [20] Cui G,Han K. Scoring Protein-protein interactions using the width of gene ontology terms and the information content of com- mon ancestors[M]/ /Huang DS,Gupta P,Wang L,et al. Emerging Intelligent Computing Technology and Applications. Berlin Heidelberg:Springer,2013:31 - 36. [21] Montecchi-Palazzi L,Beavis R,Binz PA,et al. The PSI-RMOD community standard for representation of protein modification data [J]. Nat Biotechnol,2008,26(8):864 - 866. [22] Le Novère N. Model storage,exchange and integration[J]. BMC Neurosci,2006,7(Suppl 1):S11. [23] Freiburg D. Gene regulation ontology(GRO):design principles and use cases[A]. EHealth Beyond the Horizon:Get It There:Proceed- ings of MIE2008 the ⅩⅪst International Congress of the European Federation for Medical Informatics,Gteborg,2008:9. [24] http:/ / eutils. ncbi. nlm. nih. gov. [25] Settles B. ABNER:an open source tool for automatically tagging genes,proteins and other entity names in text[J]. Bioinformat- ics,2005,21(14):3191 - 3192. [26] 刘培磊,李满生,王 挺. 蛋白质相互作用有向关系抽取的 特征选择[C]/ /第五届全国信息检索学术会议论文集. 上 海,中国中文信息学会,2009:553 - 561. [27] Nédellec C. Learning language in logic-Rgenic interaction extrac- tion challenge[C]/ /Proceedings of the 4th Learning Language in Logic Workshop (LLL05),Bonn,2005:31 - 37. [28] Hirschman L,Yeh A,Blaschke C,et al. Overview of BioCre- AtIvE:critical assessment of information extraction for biology [J]. BMC Bioinformatics,2005,6(Suppl 1):S1. (钱 全 编辑 2013 - 06 - 19 收稿) 729军事医学 2013 年 12 月 第 37 卷 第 12 期 Mil Med Sci,Vol 37,No 12,Dec,2013
本文档为【基于文献挖掘的蛋白质相互作用信息数据库设计及实现】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_037326
暂无简介~
格式:pdf
大小:327KB
软件:PDF阅读器
页数:6
分类:
上传时间:2014-03-28
浏览量:28