首页 最新NCBI-获取序列数据精品课件

最新NCBI-获取序列数据精品课件

举报
开通vip

最新NCBI-获取序列数据精品课件NCBI:获取核酸和蛋白质序列(xùliè)数据生物(shēngwù)信息学第一页,共68页。本课程主要学习(xuéxí)的内容1、获取文献信息和序列数据2、序列比对基础(jīchǔ)与BLAST入门3、核酸序列分析4、蛋白质序列分析及结构模拟5、系统发育分析6、基因组分析第二页,共68页。NCBI:获取(huòqǔ)核酸和蛋白质序列数据要想在NCBI中获取核酸(hésuān)和蛋白质的序列有多种路径(殊途同归)。本次课通过一个示例(RBP4)主要介绍一种方法。第三页,共68页。NCBI:获取核酸和蛋白质序列(xù...

最新NCBI-获取序列数据精品课件
NCBI:获取核酸和蛋白质序列(xùliè)数据生物(shēngwù)信息学第一页,共68页。本课程主要学习(xuéxí)的内容1、获取文献信息和序列数据2、序列比对基础(jīchǔ)与BLAST入门3、核酸序列分析4、蛋白质序列分析及结构模拟5、系统发育分析6、基因组分析第二页,共68页。NCBI:获取(huòqǔ)核酸和蛋白质序列数据要想在NCBI中获取核酸(hésuān)和蛋白质的序列有多种路径(殊途同归)。本次课通过一个示例(RBP4)主要介绍一种方法。第三页,共68页。NCBI:获取核酸和蛋白质序列(xùliè)数据获取序列信息的途径何谓(héwèi)参考序列GenBank序列 格式 pdf格式笔记格式下载页码格式下载公文格式下载简报格式下载 的读解第四页,共68页。示例假定(jiǎdìng)我们对人类视黄醇结合蛋白4(retinol-bindingprotein4,RBP4)感兴趣,我们可能关心以下几个问题:想获取编码RBP4的mRNA(cDNA)序列获取RBP4核酸序列想获取RBP4这个蛋白质的氨基酸序列获取RBP4蛋白质序列想获取编码RBP4的基因信息获取RBP4基因(DNA)第五页,共68页。DNAmRNACentraldogmaofmolecularbiology复制(fùzhì)转录(zhuǎnlù)翻译(fānyì)proteincDNARBP4第六页,共68页。第七页,共68页。路径(lùjìng)1:直接通过NCBI主页的Search下拉条第八页,共68页。2、输入查询(cháxún)内容1、选择(xuǎnzé)数据库GeneNucleotideProtein第九页,共68页。Nucleotide数据库包括(bāokuò)了……第十页,共68页。路径2:搜索所有(suǒyǒu)数据库显示结果会是什么呢?第十一页,共68页。NCBI的Entrez检索系统在所有(suǒyǒu)数据库中搜索含有Rbp4的记录第十二页,共68页。通过EntrezGene获取(huòqǔ)人类RBP4的参考序列(RefSeq)第十三页,共68页。使用(shǐyòng)Limits功能限定种属为人类第十四页,共68页。第十五页,共68页。第十六页,共68页。人类(rénlèi)Rbp4基因第十七页,共68页。HGNC人类基因命名(mìngmíng)委员会HPRD人类(rénlèi)蛋白质参考库1.概要(gàiyào)第十八页,共68页。2.基因(jīyīn)区域图3.基因(jīyīn)定位图mRNAlinksDNAlinksProteinlinks第十九页,共68页。4.NCBI参考(cānkǎo)序列RBP4蛋白质参考序列(xùliè)的链接RBP4mRNA参考序列(xùliè)的链接第二十页,共68页。NCBI:获取核酸和蛋白质序列(xùliè)数据获取序列信息的途径(tújìng)何谓参考序列GenBank序列格式的读解第二十一页,共68页。RefSeq(ReferenceSequences,参考(cānkǎo)序列)GenBank中对应于某个基因(DNA)、mRNA(cDNA)或蛋白质的序列可能有上百个,但相应的RefSeq记录只有一个(yīɡè)。RefSeq是NCBI将GenBank的序列再做详细整理的非冗余(non-redundent)序列。RefSeq对应于最稳定、最被人们承认因而也是最具代表性的序列。第二十二页,共68页。当存在可变剪切的情况下,一个基因(jīyīn)的表达产物就会对应不止一个RefSeq记录。例如:humanmyoglobin(人类肌红蛋白)有3个RefSeq记录:RefSeq(ReferenceSequences,参考(cānkǎo)序列)NM_005368NM_203377NM_203378NP_005359NP_976311NP_976312第二十三页,共68页。当不同的基因编码的蛋白具有相同的氨基酸序列时,这些蛋白质具有各自不同的RefSeq标识符,例如(lìrú):人类alpha-1globin和alpha-2globin基因编码的蛋白质其氨基酸序列相同,但分别具有各自的RefSeq标识符:NP_000549和NP_000508。RefSeq(ReferenceSequences,参考(cānkǎo)序列)第二十四页,共68页。4.NCBI参考(cānkǎo)序列点击RBP4mRNA参考序列(xùliè)的链接获取序列(xùliè)信息第二十五页,共68页。以GenBank序列(xùliè)格式显示RBP4mRNA序列(xùliè)的详细信息第二十六页,共68页。NCBI:获取核酸和蛋白质序列(xùliè)数据获取序列信息的途径何谓参考(cānkǎo)序列GenBank序列格式的读解以rbp4的mRNA(cDNA)参考(cānkǎo)序列为例第二十七页,共68页。GenBank序列格式(géshi)(教材Page13~18)GenBank数据库采用的GenBank序列格式已经成为序列标准格式的一种。GenBank序列格式中对序列信息分不同(bùtónɡ)的字段进行详细的标注,如序列的名称、性质、种属来源、相应的参考文献等。第二十八页,共68页。LOCUS:该字段所包含的内容从左至右依次为Locus名称:NM_006744序列长度(chángdù):941bp分子类型:mRNA(cDNA)linear(线性)GenBank数据分类:PRI(灵长类序列)序列最后修改日期:01-MAR-2009第二十九页,共68页。GenBank数据分类(fēnlèi)(教材Page13~14,表2-3)GenBank将数据库分成18个部分:1.PRI–primatesequences灵长类序列(xùliè)2.ROD–rodentsequences啮齿类序列(xùliè)3.MAM–othermammaliansequences其他哺乳类序列(xùliè)第三十页,共68页。GenBank数据(shùjù)分类4.VRT–othervertebratesequences其他(qítā)脊椎动物序列5.INV–invertebratesequences无脊椎动物序列6.PLN–plant,fungal,andalgalsequences植物、真菌和藻类序列第三十一页,共68页。GenBank数据(shùjù)分类7.BCT–bacterialsequences细菌(xìjūn)序列8.VRL–viralsequences病毒序列9.PHG–bacteriophagesequences噬菌体序列第三十二页,共68页。GenBank数据(shùjù)分类10.SYN–syntheticsequences人工合成的序列11.UNA–unannotatedsequences未经注释(zhùshì)的序列12.EST–ESTsequences(expressedsequencetags)EST序列(表达序列标签)第三十三页,共68页。GenBank数据(shùjù)分类13.PAT–patentsequences专利序列(xùliè)14.STS–STSsequences(sequence-taggedsites)STS序列(xùliè)(序列(xùliè)标签位点)15.GSS–GSSsequences(genomesurveysequences)GSS序列(xùliè)(基因组调查序列(xùliè))第三十四页,共68页。GenBank数据(shùjù)分类16.HTG–HTGSsequences(highthroughputgenomicsequences)HTGS序列(高通量基因组序列)17.HTC–HTCsequences(highthroughputcDNAsequences)HTC序列(高通量cDNA序列)18.ENV–environmentalsamplingsequences环境(huánjìng)采样序列第三十五页,共68页。DEFINITION:简短的序列(xùliè)描述Homosapiensretinolbindingprotein4,plasma(RBP4),mRNA.第三十六页,共68页。ACCESSION:Accessionnumber(索引号)NM_006744序列记录的唯一识别码,通常为1个字母后跟5个数字(shùzì)(如U12345),或2个字母后跟6个数字(shùzì)(如AF123456)RefSeq(参考序列)的索引号比较特别第三十七页,共68页。索引(suǒyǐn)号(AccessionNumbers)在数据库中,为了检索方便,DNA和蛋白质序列都被打上了索引号码作为标签(biāoqiān)。索引号码是一段由4~12个数字和/或字符组成的编码。除序列外,索引号码也可用作其他数据记录的标签(biāoqiān),如蛋白质结构、基因表达实验的结果等。不同的数据库,索引号码的记录格式不同。第三十八页,共68页。TypesofAccessionNumbers第三十九页,共68页。TypesofAccessionNumbers第四十页,共68页。RefSeq的索引(suǒyǐn)号RefSeq记录的索引(suǒyǐn)号通常由2个字母跟一下划线后再加6个或更多数字组成例如:NC_123456完整的基因组NT_123456基因组重叠群(contig)NM_123456mRNA(cDNA)NP_123456蛋白质第四十一页,共68页。TheRefSeqaccessionnumberformatandmoleculetypes第四十二页,共68页。TheRefSeqaccessionnumberformatandmoleculetypes第四十三页,共68页。VERSION:序列版本号及GI号NM_006744.3GI:55743121如果(rúguǒ)序列有任何改变,则版本号会增加,但前面的索引号不变。GI是“GeninfoIdentifier”的缩写,序列的任何改变都会被分配一个新的GI号。第四十四页,共68页。SOURCE:种属来源(láiyuán),学名(或俗名)Homosapiens(human)ORGANISM:种属的科学命名Homosapiens链接(liànjiē)到NCBI的TaxonomyDatabase第四十五页,共68页。REFERENCE:参考文献AUTHORS:作者TITLE:文献标题(biāotí)JOURNAL:发表的杂志名PUBMED:PMIDREMARK:注释链接(liànjiē)到PubMed第四十六页,共68页。COMMENT:评论(pínglùn)第四十七页,共68页。FEATURES:序列信息表(序列特征表)有关基因和基因产物的信息,以及序列中具有生物学意义的区域,其中包含(bāohán)序列中生成蛋白质和RNA分子的密码区域和一些其他特征。第四十八页,共68页。FEATURES:序列信息表(序列特征表)source:每一条(yītiáo)记录必须标注的序列特征,一般包括序列长度、序列来源、序列分子类型、物种分类进化树的位置及染色体定位等。第四十九页,共68页。gene:一段被确认为是基因的区域并且已经命名,内容主要(zhǔyào)有基因位置、基因名称以及到其他相关数据库的链接。*国际人类基因命名委员会(HomosapiensOfficialGeneSymbolandName,HGNC)链接(liànjiē)到Gene第五十页,共68页。外显子第五十一页,共68页。CDS:编码区(codingsequence),即在核酸(hésuān)序列中能翻译成蛋白质氨基酸序列的部分(有起始密码子和终止密码子)Protein_id=NP_006735.2编码(biānmǎ)蛋白的索引号第五十二页,共68页。信号肽成熟(chéngshú)肽外显子第五十三页,共68页。ORIGIN:序列开始标志(biāozhì)(该行为空行)//:序列结束标志(biāozhì)第五十四页,共68页。选择FASTA格式(géshi)(教材p11)第五十五页,共68页。FASTA格式(géshi)第五十六页,共68页。示例至此,我们从寻找人类RBP4(视黄醇结合蛋白)的基因,顺藤摸瓜获得了它的mRNA(cDNA)序列,并同时获取了与该序列相关的诸多信息。现在,我们顺便也想获取RBP4的蛋白质序列,甚至蛋白质的三级结构,那么我们是否(shìfǒu)需要重新检索呢?第五十七页,共68页。蛋白质序列(xùliè)链接核酸序列(xùliè)页面第五十八页,共68页。Links链接(liànjiē)核酸序列(xùliè)页面第五十九页,共68页。蛋白质序列(xùliè)链接核酸(hésuān)序列页面第六十页,共68页。蛋白质序列(xùliè)页面第六十一页,共68页。蛋白质序列(xùliè)页面蛋白质结构(jiégòu)链接第六十二页,共68页。第六十三页,共68页。第六十四页,共68页。第六十五页,共68页。示例至此,我们从寻找RBP4(人类视黄醇结合蛋白)的基因,顺藤摸瓜获得了它的mRNA(cDNA)序列,并同时获取(huòqǔ)了与该序列相关的诸多信息。进一步,我们通过相关链接顺便获取(huòqǔ)了RBP4的蛋白质序列,以及相关的蛋白质高级结构。第六十六页,共68页。第六十七页,共68页。Halfdayontheweb,halfmonthinthelab.savesyou-AlanBleasby第六十八页,共68页。
本文档为【最新NCBI-获取序列数据精品课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
rabbit
我是一名高中英语老师 有着丰厚的教学经验,曾经担任过学校教学教研组组长,撰写过很多论文和期刊
格式:ppt
大小:4MB
软件:PowerPoint
页数:68
分类:初中语文
上传时间:2022-01-03
浏览量:2