首页 蛋白质相互作用数据库及其应用_余鑫煜

蛋白质相互作用数据库及其应用_余鑫煜

举报
开通vip

蛋白质相互作用数据库及其应用_余鑫煜 ISSN  100727626 CN  1123870ΠQ 中国生物化学与分子生物学报Chinese Journal of Biochemistry and Molecular Biology 2008 年 3 月24 (3) :189~196 ·综述· 蛋白质相互作用数据库及其应用 余鑫煜1) ,  许正平1) ,2) 3 (浙江大学1) 医学院环境医学研究所 , 2) 医学院环境基因组研究中心 , 杭州 310058) 摘要  对蛋白质相互作用及其网络的了解不仅有助于深入理解生命活动的本质和疾病发生的机...

蛋白质相互作用数据库及其应用_余鑫煜
ISSN  100727626 CN  1123870ΠQ 中国生物化学与分子生物学报Chinese Journal of Biochemistry and Molecular Biology 2008 年 3 月24 (3) :189~196 ·综述· 蛋白质相互作用数据库及其应用 余鑫煜1) ,  许正平1) ,2) 3 (浙江大学1) 医学院环境医学研究所 , 2) 医学院环境基因组研究中心 , 杭州 310058) 摘要  对蛋白质相互作用及其网络的了解不仅有助于深入理解生命活动的本质和疾病发生的机 制 ,而且可以为药物研发提供靶点. 目前 ,通过高通量筛选、计算方法预测和文献挖掘等方法 ,获得 了大批量的蛋白质相互作用数据 ,并由此构建了很多内容丰富并日益更新的蛋白质相互作用数据 库. 本文首先简要阐述了大规模蛋白质相互作用数据产生的 3 种方法 ,然后重点介绍了几个人类相 关的蛋白质相互作用公共数据库 ,包括 HPRD、BIND、IntAct、MINT、DIP 和 MIPS ,并概述了蛋白质相 互作用数据库的整合情况以及这些数据库在蛋白质相互作用网络构建上的应用. 关键词  蛋白质相互作用 ;蛋白质相互作用数据库 ;网络构建 中图分类号  Q81114 An Introduction to Protein2Protein Interaction Database and Its Application YU Xin2Yu1) , XU Zheng2Ping1) , 2) 3 (1) Institute of Environmental Medicine , 2) Research Center for Environmental Genomics , Zhejiang University School of Medicine , Hangzhou  310058 , China) Abstract  The better understanding of protein2protein interactions is crucial for elucidating the structuralΠ functional relations of proteins , investigating their roles in associated disease development , and determining potential drug targets for clinical applications. A vast number of protein2protein interactions have been identified and the information was organized and hosted in many protein2protein interaction databases with the help of high throughput screening technologies , computational predictions and literature2mining processes. This review will first introduce the three common methods used to acquire protein2protein interaction data in large2 scale , and then will focus on the introduction of public databases for protein2protein interactions in humans , including HPRD , BIND , IntAct , MINT , DIP , MIPS , as well as the interconnection and the cross2reference of these databases. Finally we will discuss the application of these databases for building protein2protein interaction networks. Key words  protein2protein interaction ; protein2protein interaction database ; network construction 收稿日期 : 2007209220 , 接受日期 :2007211214 教育部“新世纪优秀人才支持计划”(No. NCET20520521)资助3 联系人 Tel : 0571288208164 ,E2mail : zpxu @zju. edu. cn Received : September 20 ,2007 ; Accepted : November 14 ,2007 Supported by Program for New Century Excellent Talents in University (No. NCET20520521)3 Corresponding author Tel : 0571288208164 ,E2mail : zpxu @zju. edu. cn  随着后基因组时代的到来 ,蛋白质研究变得更加广泛而深入 , 同时蛋白质与蛋白质相互作用(protein2protein interaction , PPI)的重要性也越来越受到重视. 蛋白质是生命活动的主要执行者 ,从遗传物质复制到基因表达调控 ,从细胞信号转导到新陈代谢 ,从生物体生长繁殖到细胞凋亡或坏死 ,蛋白质相互作用均在其中扮演了重要角色. 因此 ,研究蛋白质之间如何通过相互作用形成分子间调控网络 ,包括遗传调控途径、新陈代谢途径和信号传导途径 ,具有重要的生物学意义 ,它将不仅有助于从系统角度进一步理解各种生物学过程 ,还能广泛应用于探索疾病的发生机制 ,预测和评价相应的治疗手段 ,同时还可以寻找新的药物靶标 ,为新药研发开辟道路. 近几年 ,利用高通量筛选、计算方法预测、文献挖掘等技术产生了海量 PPI 数据 ,并且数据还在飞速增长中. 如何高效地存储、管理 PPI 数据 ,如何深入分析、充分利用 PPI数据 ,已成为生物信息学的一个重要课 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 . 随着 PPI 数据的增长 ,一些内容丰富、 不断扩大更新的蛋白质相互作用数据库 ( PPI Database)已经应运而生 ,成为蛋白质相互作用网络 构建和生物学通路分析的主要资源 ,也是蛋白质功 能研究的有效平台和辅助手段. 1  大规模蛋白质相互作用数据的产生 1. 1  高通量筛选技术大规模筛选相互作用蛋 白质    高通量筛选技术因其能够方便、快捷地获取大 量数据而迅速发展成熟. 近几年 ,酵母双杂交技术 (Y2H) [1 ] 、亲和纯化与质谱分析联用技术 ( Co2APΠ MS) [2 ] 、蛋白质芯片技术[3 ] 等从蛋白质组水平寻找 与目标蛋白相互作用的蛋白质 ,产生了大批量 PPI 数据. 其中 ,酵母双杂交是第一个用于全面分析蛋白 质两两相互作用的高通量筛选技术. Giot 等[4 ] 利用 该技术获得果蝇蛋白质组7 048个蛋白质的20 405对 两两相互作用 ; Rual 等[5 ] 则获得人类蛋白质组约 2 800对 PPI. 目前 ,利用酵母双杂交技术已经测定了 酵母、果蝇、线虫、人等的蛋白质相互作用组 (interactome) [6 ] . 亲和纯化与质谱分析联用技术常被 用于分析以复合物形式存在的相互作用蛋白质. Ho 等[7 ]采用高通量质谱技术鉴定蛋白质复合物 ( HMS2 PCI)的方法 ,获得了3 617组相互作用蛋白质 ,约占 整个酵母蛋白质组 25 %. 蛋白质芯片可以检测蛋白 质之间、蛋白质与脂质之间、蛋白质与 DNA 之间的 相互作用 ,具有相当广泛的应用前景. Zhu 等[8 ] 克隆 了酵母的5 800个开放阅读框 ,并且表达、纯化了相 应的蛋白质 ,然后利用酵母蛋白质组芯片筛选了这 些蛋白质的相互作用蛋白 ,得到大量钙离子结合蛋 白和磷脂相互作用蛋白. 上述实验方法从不同角度丰富并扩大了 PPI 数 据 ,但是 ,高通量筛选得到的 PPI 数据还远远不够完 善[6 , 9~11 ] ,如数据的假阳性 (false positive) 和假阴性 (false negative)概率很高 ,实验的可重复性和实验结 果之间的重叠率很低等. 这种现象主要是由每一种 实验技术本身固有的内在缺陷和选择偏好性以及不 同实验室、不同实验样本之间的误差造成的. 因此 , 高通量实验方法得到的 PPI 数据需要进一步扩充 , 可信度有待进一步提高. 1. 2  计算方法预测蛋白质相互作用 利用生物信息学的手段预测蛋白质相互作用 , 是近几年发展起来的新方法 ,相比于实验方法具有 成本低、速度快的优点. 它综合并参考数学、统计学、 信息学、化学等学科的理论和方法 ,基于生物学的背 景知识、假设和模型 , 通过计算机模拟计算 ( in silico)推测得到大量新的 PPI. 目前 ,已发展出很多 PPI计算预测方法 ,其中比 较常见的有基于基因组信息的系统发育谱 (phylogenetic profile) [12 ]和基因邻接法 (conserved gene neighborhood) [13 ] ; 基于进化同源关系的镜像树法 (mirrotree) [14 ]和关联突变法 (correlated mutant) [15 ] 等. 也有研究者利用 PPI网络的拓扑结构[16 ] 或 PPI 网络 的保守模体 (motif) [17 ]预测新的 PPI. 最近 ,Shen 等[18 ] 基于蛋白质一级序列信息预测得到16 000多对可信 度较高的 PPI. 另外 ,由于蛋白质相互作用受多种因 素影响 ,综合蛋白质相互作用的各种特征 ,用不同的 方法同时进行预测能有效提高预测可信度. Ben2Hur 等[19 ]同时利用蛋白质一级序列信息、基因本体论注 释信息、物种同源关系以及蛋白质网络的拓扑性质 , 采用核心方法 ( kernel method) 预测 PPI ,通过测试 BIND 数据库 ,结果以 1 %假阳性率预测得到 80 %可 信 PPI ,提示此法大大提高了预测准确率. 1. 3  文献挖掘搜索蛋白质相互作用 文献挖掘基于自然语言处理 ( natural language processing , NLP) ,根据一定的语义和模式从文献中 自动提取相关信息. 大量已知的 PPI 信息存储于生 物、医学相关的科学文献中 ,如美国国立医学图书馆 的 MEDLINE 数据库存储了超过 4 800 种杂志的 15 000 000篇文献摘要或全文 ,并且实时更新. 文献 数据库涵盖大量 PPI 信息 ,甚至包括 PPI 的亚细胞 定位、生物学功能等更为详尽的信息 ,成为文献挖掘 的必要的数据基础. Daraselia 等[20 ] 采用一种称为 MedScan 的方法从 PubMed 提取了 1 000 000 多条 PPI ,提取结果与 BIND、DIP 数据库比较后发现 ,数据 准确率高达 90 %. Jang 等[21 ] 则从 PubMed 收集文献 摘要 ,自动查询并提取蛋白质两两相互作用信息 ,其 获得的 67137 %PPI可在 DIP 数据库中找到. 相比于 高通量筛选方法和计算预测方法 ,文献挖掘得到的 PPI有详细的生物学实验支持 ,其结果有“源”可寻、 有“据”可依 ,更加可靠、可信. 因此 ,大部分 PPI 数据 库采用文献挖掘技术搜集 PPI. 2  蛋白质相互作用数据库 截至 2006 年 ,与 PPI 相关的数据库已超过 224 个[22 ] ,并且还处于增长中 ,成为生物学网络和通路 构建的主要资源. 本文主要讨论人类相关的蛋白质 相互作用公共数据库 ,它们同时也是目前使用最广 泛、数据信息最完善的公共数据库. 091 中国生物化学与分子生物学报 24 卷 2. 1  BIND 数据库 BIND(biomolecular interaction network database) 数 据库[23 ]是 BOND(biomolecular object network databank) 数据库的一个子数据库 ,收录已知的生物分子之间 的相互作用 ,不仅包括蛋白质之间的相互作用 ,也包 括蛋白质与 DNA、RNA、小分子、脂质以及糖类物质 之间的相互作用. BIND 数据库每日更新 ,覆盖面广 , 包含人、果蝇、酵母、线虫等物种的 PPI. 在 BIND 数 据库中 , PPI 被分成 3 大类 : 二元分子相互作用 ( binary interactions ) 、分 子 复 合 物 ( molecular complexes)以及生物途径 (biological pathways) ,从不同 层次表示分子间的相互作用关系. BIND 提供浏览、 查询、下载和软件服务 , 支持多种数据格式 , 如 XML、BioPAX、CSV、SIF 等 ,并支持第 3 方软件 ,如 Cytoscape、Bioperl 等. 此外 ,BIND 用一系列简单图形 表示的标志符 (ontoglyph) 描述蛋白质功能 ,包括 34 个功能分类标志、25 个蛋白结合分类标志和 24 个 亚细胞定位分类标志 ,其分类术语与基因本体论 (gene ontology) 保持一致. 标志符的引入 ,很大程度 上简化了蛋白质功能的复杂描述. BIND 数据库自 1999 年开放以来 ,一直致力于 存储生物分子相互作用的完整信息 ,同时致力于开 发数据分析的各种生物学软件 ,方便全世界范围内 的科学工作者免费使用[23 ] . 但是 ,BIND 数据库并未 实践它的全部诺言[24 ] :数据重复冗余 ,更新缓慢并 且逐步开始商业化. 2. 2  DIP数据库 DIP(database of interacting proteins) 数据库[25 ] 专 门存储经实验证实的来自文献报道的二元 PPI ,以 及来自 PDB (protein data bank) 数据库的蛋白质复合 物 ,其目的在于建立一个简单、易用、高度可信的 PPI公共数据库. DIP 数据库的 PPI 包含果蝇、酵母、 家鼠、挪威鼠、人等多个物种 ,提供多种查询方式 ,用 户可直接基于蛋白质名称、物种查询相互作用蛋白 质 ;也可基于序列匹配的 BLAST 搜索和模体 (motif) 搜索查询相互作用蛋白质. JDIP 是 DIP 数据库提供 的一个基于 Java 语言的可视化应用工具 ,把 PPI 数 据以网络形式更加直观地展现出来. 由于 DIP 数据的可靠性 ,使之被选为评估高通 量筛选和Π或计算机预测得到的 PPIs 的黄金 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 集 , 并且提供 PPIs 真实性评估服务 ,包括基于平行同源 关系的 PVM 法 (paralogous verification method) 、基于 表达谱分析的 EPR 法 (expression profile reliability) [26 ] 以及基于结构域相互作用的 DPV 法 ( domain pair verification) [27 ] . 此外 ,DIP 数据库还发展了 3 个子数 据库 ,Live2DIP、DLRP 和 Prolink 数据库. Live2DIP[28 ] 是DIP 的扩展 ,它在描述 PPI时涉及 PPI发生的细胞 状态和状态转变情况 ,也就是实时 PPI ;DLRP[29 ]是关 于蛋白质配体与受体配对的数据库 ; Prolink[30 ] 是利 用系统发生谱、基因簇等计算方法预测得到的 PPI 数据库. 2. 3  IntAct 数据库 IntAct [31 ]也是一个存储和分析生物分子间相互 作用的公共数据库. 主要记录二元相互作用及其实 验方法、实验条件和相互作用结构域 ,包括人、酵母、 果蝇、大肠杆菌等物种. IntAct 数据库分基本查询和 高级查询 ,基本查询可以根据蛋白质名称、PubMed ID等进行简单搜索 ; 高级查询根据实验方法和 IntAct 自定义的控制词汇 (controlled vocabularies) 进 行查询 ,查询结果更加精确. IntAct 支持 PSI2MI XML 110 和 215 格式 ,提供 PPI 网络的可视化在线分析 , 同时支持 Cytoscape、Proviz 等第 3 方网络构建软件. 除了存储并查询相互作用蛋白质信息 , IntAct 基于“Pay2As2You2Go”算法预测下拉实验 (pull2down) 的最佳诱饵蛋白. IntAct 研究小组还 建议 关于小区增设电动车充电建议给教师的建议PDF智慧城市建议书pdf给教师的36条建议下载税则修订调整建议表下载 生物学家 在文献发表之前向该数据库直接提交 PPI 信息[32 ] . 这一过程如同向 GenBank 数据库直接提交核苷酸序 列一样 ,可以极大方便数据的增加和管理. 2. 4  HPRD 数据库 HPRD ( human protein reference database ) 数据 库[33 ]是包含蛋白质注释、PPI、转录后修饰、亚细胞 定位等多种信息的综合数据库. 该数据库只收录人 的 PPIs ,目前已包含25 000多个蛋白质和37 000多条 相互作用信息 ,是来源于文献挖掘的最大的人 PPI 数据库. HPRD 对 PPI 数据有 2 种分类方式. 一是根 据相互作用的拓扑结构和参与数目 ,将 PPI 分成二 元相互作用和复杂相互作用 (复合物) ;二是根据实 验类型 ,将 PPI 分为体内 ( in vivo) ,体外 ( in vitro) 和 酵母双杂交 ( Y2H) 3 类相互作用. HPRD 数据库中的蛋白质可链接到 GenProt Viewer ,显示该蛋白质的编码基因在染色体上的位 置和转录信息 ;也可链接到 NetPath ,它是一系列人 信号转导通路的集合 ,显示该蛋白质参与哪些信号 通路和发挥怎样的生物学功能. HPRD 还包含一个 工具软件“磷酸化模体探测器”(phosphomotif finder) , 检测蛋白质是否含有磷酸化位点. 2. 5  MINT数据库 MINT(molecular interaction database) [34 ] 数据库建 191第 3 期 余鑫煜等 :蛋白质相互作用数据库及其应用   立的目标是提取文献信息 ,存储经实验证实的生物 分子相互作用. 目前 ,MINT 主要存储蛋白质物理相 互作用 ,尤其强调哺乳动物的 PPIs ,同时包含部分酵 母、果蝇、病毒的 PPIs. 在查询时 ,MINT 可根据蛋白 质名称、各数据库 ID (如 UniProtKB、PDB、Ensembl、 FlyBase、OMIM) 、关键词等进行基本查询 ,也可与 DIP 数据库一样 ,按照序列 BLAST 查找同源相互作用. MINT支持平面文件格式、PSI2MI 格式、Osprey 格式 , 提供基于 Java 语言的网络可视化应用工具“MINT Viewer”. MINT为每一个 PPI 分配一个根据 PPI 作用位 点的数目、实验类型和文献被引用次数而确定的可 信值 (confidence score) ,作为 PPI 可信度的一个参考 标准. HomoMINT[35 ] 是 MINT 数据库的姊妹数据库 , 专门存储由其他物种与人同源比较后得到的人 PPI. 2. 6  MIPS 数据库 MIPS ( mammalian protein2protein interaction database)数据库[36 ] 同样利用文献挖掘技术 ,专门存储哺乳动物的 PPI ,主要包括人、大鼠、小鼠等物种.该数据库详细记录了蛋白质相互作用的类型、实验证据及其结合位点 ,提供蛋白质名称、实验方法、物种等多种查询方式 ,查询结果以短格式 (short format)和长格式 (long format)两种形式显示. 前者以列表形式显示相互作用蛋白质 ,后者则详细描述 PPI 信息 ,包括 PPI的参考文献、实验证据、结合位点、生物学功能等. MIPS 也提供 PPI 可视化网络分析 ,同时可链接到由同一研究小组开发的小鼠基因组数据库PEDANT[37 ] .2. 7  其他蛋白质相互作用数据库以上六个数据库主要是人类相关的 PPI 公共数据库 ,此外还有其他一系列物种特异性 PPI 数据库和商业 PPI 数据库. 由 Bader 等[22 ] 开发的 Pathguide(http :ΠΠpathguide. org)提供大部分 PPI 相关的数据库列表和链接 , Table 1 列出了其他部分 PPI 数据库.    Table 1  List of protein2protein interaction databases Database URL Illustration Predictome http :ΠΠpredictome. bu. eduΠ Predicted functional associations and interactions HPID http :ΠΠwilab. inha. ac. krΠhpidΠ Human Protein Interaction Database Reactome http :ΠΠwww. reactome. orgΠ A curated knowledgebase of biological pathways to develop a curated resource of pathway and biological reactions in humans STRING http :ΠΠstring. embl. deΠ A database of known and predicted PPIs , derived from four sources :Genomic Context , High2 throughput Experiments , ( Conserved ) Coexpression and Previous Knowledge PZDBase http :ΠΠicb. med. cornell. eduΠservicesΠpdzΠstart A database focused only on PPIs invoving proteins with PZD domains OPHID http :ΠΠophid. utoronto. caΠophidΠ The Online Predicted Human Interaction Database , designed to be aresource for the laboratory scientist to explore known and predicted PPIs CYGD http :ΠΠmips. gsf . deΠprojΠyeastΠCYGDΠinteractionΠ PPIs section of the Comprehensive Yeast Genome Database AfCS http :ΠΠwww. signaling2gateway. orgΠ Alliance for Cellular Signaling Molecule Pages Database SPIDer http :ΠΠcmb. bnu. edu. cnΠSPIDerΠindex. html Saccharomyces cerevisiae PPI Database , a database of predicted PPI network in yeast Fly2DPI http :ΠΠflydpi. nhri. org. twΠ Drosophila melanogaster database of protein interactomes ProNet http :ΠΠwww. myriad2pronet. comΠ Commercial PPI database BioGRID http :ΠΠwww. thebiogrid. orgΠ Generally repository for interaction datasets , curated set of physical and genetic interactions ResNet http :ΠΠwww. ariadnegenomics. comΠproductsΠ databasesΠresnetΠ Commercial PPI database by literature mining 291 中国生物化学与分子生物学报 24 卷 3  蛋白质相互作用数据库的整合与应用 3. 1  蛋白质相互作用数据库的整合 统计分析表明 ,数据库之间的蛋白质和 PPIs 的 重叠率很低[36 ,38 ] . 以 HPRD 的 PPI 数据为例 [38 ] , HPRD 中的36 617对 PPI 在 MINT、IntAct、BIND 中重 复出现的有8 690对、8 031对、4 903对 ,在 DIP、MIPS 中则仅重复出现 801 对和 307 对 ,分别占 HPRD 数 据库 PPI 总数的 23173 %、21193 %、13139 %、2119 % 和 0182 %. 我 们 随 机 查 询 了 GAPDH、PLSCR1、FBLN2、ANG、P53、VEGF、UBF、ACTA1 等 8 个蛋白质在 7 个数据库中的相互作用蛋白质 ,查询结果如Table 2 所示. 从中可以发现 ,同一个蛋白质在不同的数据库查询得到不同的相互作用蛋白质 ,同样提示了数据库的不完善性和低重叠率. 事实上 ,各 PPI数据库的数据量、存储格式、注释方式、查询形式不尽相同 (Table 3) ,阻碍了数据库之间的信息交换和数据整合 ,已经成为数据库发展和应用的一个瓶颈. Table 2  Comparison of protein2protein interactions for a test set of proteinsa Protein BIND DIP IntAct HPRD MINT MIPS UniHI APID GAPDH 6 0 17 37 56 0 143 69 PLSCR1 2 0 64 72 66 0 82 94 FBLN2 1 0 1 22 2 0 53 22 ANG 4 1 4 4 0 0 8 7 P53 126 38 101 240 133 0 347 322 VEGF 6 0 2 15 2 0 6 17 UBTF 3 0 2 22 0 0 46 28 ACTA1 3 0 23 91 3 1 102 29 aQurey for interactions in homo sapiens , not including other species. Table 3  Comparison of PPI databases in public Database URL Number of Proteinsa Number of PPIsb Data source Data format Network visulization Particularity BIND http :ΠΠbind. ca Unknown > 200 000 Literature mining XML , ASN. 1 , BioPAX , CSV , SIF , XML No Ontoglyph DIP http :ΠΠdip. doe2mbi. ucla. eduΠ 19 490 56 186 Literaturemining MIF ,XIN Yes PPI validation IntAct http :ΠΠwww. ebi. ac. ukΠ intactΠsiteΠ 57 850 154 773 Literaturemining PSI2MI Yes ControlledVocabularies HPRD http :ΠΠwww. hprd. orgΠ 25 661 38 167 Literature mining PSI2MI No PhosphoMotifFinder GenProt Viewer MINT http :ΠΠmint. bio. uniroma2. itΠmintΠ 28 186 103 808 Literaturemining PSI2MI ,Osprey Yes HomoMINT MIPS http :ΠΠmips. gsf . deΠ > 900 > 1 800 Literature mining PSI2MI , XML No PEDANT a ,bData collected at September 19 , 2007 , including proteins and protein2protein interactions from all of the species in the database   为了分担工作量 ,避免数据库之间出现信息冗 余现象 ,同时保证数据结构和注释的一致性 ,5 个数 据库 (BIND、MINT、DIP、MPact 以及 IntAct) 联合成 立了 IMEx 联 盟 ( international molecular2interaction exchange consortium) [31 ,34 ] ,在数据库整合方面跨出了 重要一步. 例如 , IMEx 联盟建议所有 PPI 数据库采 用 PSI2MI格式存储数据. 除了公共数据库之间成立 联盟 ,探讨数据库整合机制外 ,目前还出现很多整合了多个公共数据库信息的二级数据库 ,它在数量和质量上都优于原先的公共数据库. 如 ,Cerami 等[39 ]开发了基于 web 服务的开放软件 cPath ,利用 SEF(standard exchange format) 格式通过客户端接口把多个数据库整合到一起 ,从而可以更广泛地选择、存储并查询 PPI. 目前 , cPath 已经整合了 DIP、HPRD、 391第 3 期 余鑫煜等 :蛋白质相互作用数据库及其应用   MINT、IntAct、Reactome 等数据库. Chaurasia 等[40 ] 则基 于BIND、HPRD、DIP、OPHID 等 PPI公共数据库 ,通过 信息筛选、数据整合后构建了 UniHI (Unified Human Interactome)二级数据库. UniHI 是专门针对人的 PPI 数据库 ,信息量更丰富 (见 Table 2) ,查询结果更可 靠 ,同时可选择性地以网络形式可视化分析 PPIs. 而 由 Prieto 等[41 ] 共 同 开 发 的 APID ( agile protein interaction data analyzer)则是针对蛋白质相互作用的 网络分析工具 ,它不仅整合了 BioGRID、BIND、DIP、 HPRD、MIPS 等 PPI数据库 ,可查询并分析 PPI 数据 , 如可信度分析 , GO (gene ontology) 分析 ,还可在线生 成 PPI网络并评价网络的生物学特性. 3. 2  蛋白质相互作用网络的构建 现有 PPI数据库提供了数量丰富而质量参差不 齐的生物学信息 ,如何从这些数据库中挖掘有效信 息成为数据库发展和应用的热点话题 ,其中一个重 要的应用方向就是构建蛋白质相互作用网络. 通过 构建以结点 (node) 和连线 (link) 表示的蛋白质相互 作用网络可以从不同的系统尺度提取蛋白质的有效 信息 ,得到单个蛋白质无法获得的综合信息. 蛋白质 网络可以显示蛋白质从细胞表面到细胞核的一系列 变化过程 ,揭示参与该过程的一系列生物学事件和 作用因子 ,提示某一过程的中断或变化可能导致的 生物学后果等. 蛋白质相互作用在各项生命活动中都扮演了重 要的角色 ,正常的蛋白质相互作用的改变或异常的 蛋白质相互作用的产生均可能导致疾病的发生 ,因 此 ,基于 PPI构建蛋白质网络和生物学通路 ,可以建 立 PPI及其通路与疾病之间的关系 ,从而理解疾病 的病理生理机制 ,确定药物干预的靶点. 目前 ,构建 蛋白质相互作用网络已成为药物 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 的有力工具 , 它改变了传统药物研发专注于某一蛋白质或复合物 的特性而带来的研发周期长、成本高、抗药性和耐药 性高发的缺点[42 ] . 最近 ,Lim 等[43 ] 利用酵母双杂交 技术筛选与 54 个遗传性共济失调相关蛋白可能有 相互作用的蛋白质 ,结果得到 42 个共济失调相关诱 饵蛋白和 561 个相互作用捕获蛋白 ,共计 770 对 PPI. 最后 ,根据酵母双杂交结果、BIND、DIP 等数据 库查询结果以及同源保守 PPIs 搜索结果构建了遗 传性共济失调相关蛋白的相互作用网络. 该网络显 示这些表面上无相关性的蛋白质在功能上有很大的 联系 ,为系统性研究共济失调相关病症提供了单个 基因无法揭示的线索和信息 ,揭示了发病机理的可 能关键作用因子. 例如 ,对网络中的 3 个中心蛋白做 进一步分析后提示 ,某一亚类遗传性共济失调可能 与 RNA 剪切紊乱相关. 作者同时提出基于疾病或表 型的蛋白质相互作用网络研究可以应用到很多紊乱 相关的疾病中 ,如帕金森综合症、糖尿病 ,揭示这些 疾病的候选基因、可能的关键作用因子等 ,为疾病治 疗提供新的靶标. 蛋白质相互作用网络和通路构建正在起步阶 段[44 ] ,目前 ,已出现很多具有强大的 PPI网络和生物 学通路构建功能的公共软件和商业软件 ,如 Pathway Studio、CellDesigner、PATIKA、Cytoscape、VisANT 等 ,同 时也出现了很多表征和描述蛋白质网络的生物学特 性的定义和算法[45 ] . 但是 ,由于 PPI数据库的静态特 征 ,目前的网络构建大部分也都是静态的 ,即蛋白质 相互作用是一个概念化描述 ,每一个 PPI 没有具体 涉及其发生的时间、地点、背景和环境. 因此 ,蛋白质 网路构建的最大挑战在于如何呈现一个随着细胞状 态和时空条件而变化的可视化的动态网络[46 ,47 ] . 4  结语 PPI数据库是近年才开始被研究者发掘并利用 的生物学工具 ,很多 PPI 相关数据库从不同的侧重 点描述 PPIs ,为实验研究提供素材和线索. 但是 , PPIs 涉及生物学过程的方方面面 ,目前信息描述过 于简单 ,还有很多信息尚待发掘 ,而且存在数据库之 间的数据重复冗余、数据结构不一致等问题 ,这些成 为 PPI数据库发展的难题和重点. 针对上述问题 ,已 提出一些解决 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 并在逐步执行 ,但其任务还很艰 巨 ,需要计算生物学家的进一步共同努力. 相信随着 PPI 数据库的不断完善 ,其应用领域将越来越深入 而广泛. 参考文献 ( References) [ 1 ]  Parrish J R , Gulyas KD , Finley R L. Yeast two2hybrid contributions to interactome mapping [J ] . Curr Opin Biotechnol , 2006 , 17 (4) : 3872393 [ 2 ]  Pandey A , Mann M. Proteomics to study genes and genomes [J ] . Nature , 2000 , 405 (6788) : 8372846 [ 3 ]  Hall D A , Ptacek J , Snyder M. Protein microarray technology[J ] . Mech Ageing Dev , 2007 , 128 (1) : 1612167 [ 4 ]  Giot L , Bader J S , Brouwer C , et al . A protein interaction map of Drosophila melanogaster [J ] Science , 2003 , 302 (5651) : 172721736 [ 5 ]  Rual J F , Venkatesan K, Hao T , et al . Towards a proteome2scale map of the human protein2protein interaction network [J ] . Nature , 2005 , 437 (7062) : 117321178 [ 6 ]  Shoemaker B A , Panchenko A R. Deciphering protein2protein interactions. Part I. Experimental techniques and databases [ J ] . 491 中国生物化学与分子生物学报 24 卷 PLoS Comput Biol , 2007 , 3 (3) : e42 [ 7 ]  Ho Y, Gruhler A , Heilbut A , et al . Systematic identification of protein complexes in Saccharomyces cerevisiae by mass spectrometry [J ] . Nature , 2002 , 415 (6868) : 1802183 [ 8 ]  Zhu H , Bilgin M , Bangham R , et al . Global analysis of protein activities using proteome chips [J ] . Science , 2001 , 293 (5537) : 210122105 [ 9 ]  Uetz P , Finley R L. From protein networks to biological systems [J ] . FEBS Lett , 2005 , 579 (8) : 182121827 [10 ]  Stanyon C A , Liu G, Mangiola B A , et al . A Drosophila protein2 interaction map centered on cell2cycle regulators [J ] . Genome Biol , 2004 , 5 (12) : R96 [11 ]  Sprinzak E , Sattath S , Margalit H. How reliable are experimental protein2protein interaction data ? [J ] . J Mol Biol , 2003 , 327 (5) : 9192923 [12 ]  Pellegrini M , Marcotte E M , Thompson MJ , et al . Assigning protein functions by comparative genome analysis : protein phylogenetic profiles [J ] . Proc Natl Acad Sci U S A , 1999 , 96 (8) : 428524288 [13 ]  Overbeek R , Fonstein M , D’Souza M , et al . The use of gene clusters to infer functional coupling [J ] . Proc Natl Acad Sci U S A , 1999 , 96 (6) : 289622901 [14 ]  Pazos F , Valencia A. Similarity of phylogenetic trees as indicator of protein2protein interaction [J ] . Protein Eng , 2001 , 14 (9) : 6092614 [15 ]  Halperin I , Wolfson H , Nussinov R. Correlated mutations : advances and limitations. A study on fusion proteins and on the Cohesin2 Dockerin families [J ] . Proteins , 2006 , 63 (4) : 8322845 [16 ]  Yu H , Paccanaro A , Trifonov V , et al . Predicting interactions in protein networks by completing defective cliques[J ] . Bioinformatics , 2006 , 22 (7) : 8232829 [17 ]  Albert I , Albert R. Conserved network motifs allow protein2protein interaction prediction [J ] . Bioinformatics , 2004 , 20 ( 18) : 33462 3352 [18 ]  Shen J , Zhang J , Luo X , et al . Predicting protein2protein interactions based only on sequences information [J ] . Proc Natl Acad Sci U S A , 2007 , 104 (11) : 433724341 [19 ]  Ben2Hur A , Noble W S. Kernel methods for predicting protein2 protein interactions [J ] . Bioinformatics , 2005 , 21 Suppl 1 : i 38246 [20 ]  Daraselia N , Yuryev A , Egorov S , et al . Extracting human protein interactions from MEDLINE using a full2sentence parser [ J ] . Bioinformatics , 2004 , 20 (5) : 6042611 [21 ]  Jang H , Lim J , Lim J H , et al . Finding the evidence for protein2 protein interactions from PubMed abstracts [ J ] . Bioinformatics , 2006 , 22 (14) : e2202226 [22 ]  Bader G D , Cary M P , Sander C. Pathguide : a pathway resource list . Nucleic Acids Res [J ] , 2006 , 34 (Database issue) : D5042506 [23 ]  Alfarano C , Andrade C E , Anthony K, et al . The biomolecular interaction network database and related tools 2005 update [ J ] . Nucleic Acids Res , 2005 , 33 (Database issue) : D4182424 [24 ]  Galperin M Y. The molecular biology database collection : 2007 update. Nucleic Acids Res[J ] , 2007 , 35 (Database issue) : D324 [25 ]  Salwinski L , Miller C S , Smith A J , et al . The database of interacting proteins : 2004 update[J ] . Nucleic Acids Res , 2004 , 32 (Database issue) : D4492451 [26 ]  Deane C M , Salwinski L , Xenarios I , et al . Protein interactions : two methods for assessment of the reliability of high throughput observations[J ] . Mol Cell Proteomics , 2002 , 1 (5) : 3492356 [27 ]  Deng M , Mehta S , Sun F , et al . Inferring domain2domain interactions from protein2protein interactions [ J ] . Genome Res , 2002 , 12 (10) : 154021548 [28 ]  Duan X J , Xenarios I , Eisenberg D. Describing biological protein interactions in terms of protein states and state transitions : the LiveDIP databas[J ]e. Mol Cell Proteomics , 2002 , 1 (2) : 1042116 [29 ]  Graeber T G, Eisenberg D. Bioinformatic identification of potential autocrine signaling loops in cancers from gene expression profiles [J ] . Nat Genet , 2001 , 29 (3) : 2952300 [30 ]  Bowers P M , Pellegrini M , Thompson M J , et al . Prolinks : a database of protein functional linkages derived from coevolution [J ] . Genome Biol , 2004 , 5 (5) : R35 [31 ]  Kerrien S , Alam2Faruque Y, Aranda B , et al . IntAct —open source resource for molecular interaction data [ J ] . Nucleic Acids Res , 2007 , 35 (Database issue) : D56
本文档为【蛋白质相互作用数据库及其应用_余鑫煜】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_117213
暂无简介~
格式:pdf
大小:371KB
软件:PDF阅读器
页数:8
分类:工学
上传时间:2013-10-19
浏览量:43