首页 DNA序列分类

DNA序列分类

举报
开通vip

DNA序列分类DNA序列分类 经管数学 2000-A题 DNA序列分类 2000年6月,人类基因组计划中DNA全序列草图完成,预计2001年可以完成精确的全序列图,此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A,T,C,G按一定顺序排成的长约30亿的序列,其中没有“断句”也没有标点符号,除了这4个字符表示4种碱基以外,人们对它包含的“内容”知之甚少,难以读懂。破译这部世界上最巨量信息的“天书”是二十一世纪最重要的任务之一。在这个目标中,研究DNA全序列具有什么结构...

DNA序列分类
DNA序列分类 经管数学 2000-A 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 DNA序列分类 2000年6月,人类基因组 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 中DNA全序列草图完成,预计2001年可以完成精确的全序列图,此后人类将拥有一本 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 着自身生老病死及遗传进化的全部信息的“天 关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf ”。这本大自然写成的“天书”是由4个字符A,T,C,G按一定顺序排成的长约30亿的序列,其中没有“断句”也没有标点符号,除了这4个字符表示4种碱基以外,人们对它包含的“内容”知之甚少,难以读懂。破译这部世界上最巨量信息的“天书”是二十一世纪最重要的任务之一。在这个目标中,研究DNA全序列具有什么结构,由这4个字符排成的看似随机的序列中隐藏着什么规律,又是解读这部天书的基础,是生物信息学(Bioinformatics)最重要的课题之一。 虽然人类对这部“天书”知之甚少,但也发现了DNA序列中的一些规律性和结构。例如,在全序列中有一些是用于编码蛋白质的序列片段,即由这4个字符组成的64种不同的3字符串,其中大多数用于编码构成蛋白质的20种氨基酸。又例如,在不用于编码蛋白质的序列片段中,A和T的含量特别多些,于是以某些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。此外,利用统计的方法还发现序列的某些片段之间具有相关性,等等。这些发现让人们相信,DNA序列中存在着局部的和全局性的结构,充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。这种被称为粗粒化和模型化的方法往往有助于研究规律性和结构。 作为研究DNA序列的结构的尝试,提出以下对序列集合进行分类的问题: 1)下面有20个已知类别的人工制造的序列(见下页),其中序列标号1—10 为A类,11-20为B类。请从中提取特征,构造分类方法,并用这些已知类别的序列,衡量你的方法是否足够好。然后用你认为满意的方法,对另外20个未标明类别的人工序列(标号21—40)进行分类,把结果用序号(按从小到大的顺序)标明它们的类别(无法分类的不写入): A类 ; B类 。 请详细描述你的方法,给出计算程序。如果你部分地使用了现成的分类方法,也要将方法名称准确注明。 这40个序列也放在如下地址的网页上,用数据文件Art-model-data 标识,供下载: 网易网址:www.163.com 教育频道 在线试题; 教育网: www.cbi.pku.edu.cn News mcm2000 教育网: www.csiam.edu.cn/mcm 2)在同样网址的数据文件Nat-model-data 中给出了182个自然DNA序列,它们都较长。用你的分类方法对它们进行分类,像1)一样地给出分类结果。 提示:衡量分类方法优劣的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 是分类的正确率,构造分类方法有许多途径,例如提取序列的某些特征,给出它们的数学表示:几何空间或向量空间的元素等,然后再选择或构造适合这种数学表示的分类方法;又例如构造概率统计模型,然后用统计方法分类等。 经管数学 2000-B题 钢管订购和运输 ? A,A,?,A1215 要铺设一条的输送天然气的主管道, 如图一所示(见下页)。经筛选后可以 S,S,?S127生产这种主管道钢管的钢厂有。图中粗线表示铁路,单细线表示公路,双细线表示要铺设的管道(假设沿管道或者原来有公路,或者建有施工公路),圆圈表示火车站,每段铁路、公路和管道旁的阿拉伯数字表示里程(单位km)。 为方便计,1km主管道钢管称为1单位钢管。 Si一个钢厂如果承担制造这种钢管,至少需要生产500个单位。钢厂在指定期限内能生产该钢管的 spii最大数量为个单位,钢管出厂销价1单位钢管为万元,如下表: i1 2 3 4 5 6 7 s 800 800 1000 2000 2000 2000 3000 i p 160 155 155 160 155 150 160 i 1单位钢管的铁路运价如下表: 里程(km) ?300 301,350 351,400 401,450 451,500 运价(万元) 20 23 26 29 32 里程(km) 501,600 601,700 701,800 801,900 901,1000 运价(万元) 37 44 50 55 60 1000km以上每增加1至100km运价增加5 公路运输费用为1单位钢管每公里0.1万元(不足整公里部分按整公里计算)。 A,A,?,A1215钢管可由铁路、公路运往铺设地点(不只是运到点,而是管道全线)。 (1)请制定一个主管道钢管的订购和运输计划,使总费用最小(给出总费用)。 (2)请就(1)的模型分析:哪个钢厂钢管的销价的变化对购运计划和总费用影响最大,哪个钢厂钢管的产量的上限的变化对购运计划和总费用的影响最大,并给出相应的数字结果。 (3)如果要铺设的管道不是一条线,而是一个树形图,铁路、公路和管道构成网络,请就这种更一般的情形给出一种解决办法,并对图二按(1)的要求给出模型和结果。 经管数学 30 290 S7 S4 160 S3 320 20 160 20 70 690 S2 30 690 70 S6 A15 1200 170 110 500 720 520 88 62 420 A14 462 10 202 S5 A13 70 S1 210 1100 10 42 220 A12 20 12 480 A11 195 300 A10 31 306A9680 0 111150 A8201 10 5 A1A1600 10 1 1 A7194 205 450 A680 11A5 A11 图一 A1606 750 2 A4 1 3 A3 301 104 A2 A1 30 290 S7 S4 A18 160 S3 320 20 70 A20 160 20 690 S2 100 30 260 690 S6 70 130 (A21) A15 1200 170 110 500 A19 720 520 190 88 62 A14 420 A16 A17 462 10 202 S5 A13 70 S1 1100 210 10 42 220 A12 20 12 480 A11 195 300 31 A10 306A9 680 0 1150 10 A8201 5 A1600 10 A7 1 194 205 450 A6 80 A5 606 图二 750 2 A4 3 A3 301 104 A2 A1 经管数学 CMCM2000-C题 飞越北极 今年6月,扬子晚报发布消息:“中美航线下月可飞越北极,北京至底特律可节省4小时”,摘要如下: 7月1日起,加拿大和俄罗斯将允许民航班机飞越北极,此改变可大幅度缩短北美与亚洲间的飞行时间,旅客可直接从休斯敦,丹佛及明尼阿波利斯直飞北京等地。据加拿大空中交通管制局估计,如飞越北极,底特律至北京的飞行时间可节省4个小时。由于不需中途降落加油,实际节省的时间不止此数。 假设:飞机飞行高度约为10公里,飞行速度约为每小时980公里;从北京至底特律原来的航线飞经以下10处: A1 (北纬31度,东经122度); A2 (北纬36度,东经140度); A3 (北纬 53度,西经165度); A4 (北纬62度,西经150度); A5 (北纬 59度,西经140度); A6 (北纬 55度,西经135度); A7 (北纬 50度,西经130度); A8 (北纬 47度,西经125度); A8 (北纬 47度,西经122度); A10 (北纬 42度,西经87度)。 请对“北京至底特律的飞行时间可节省4小时“从数学上作出一个合理的解释,分两种情况讨论: (1) 设地球是半径为6371千米的球体; (2) 设地球是一旋转椭球体,赤道半径为6378千米,子午线短半轴为6357千米。 CMCM2000,D题 空洞探测 山体、隧洞、坝体等的某些内部结构可用弹性波测量来确定。一个简化问题可描述为,一块均匀介质构成的矩形平板内有一些充满空气的空洞,在平板的两个邻边分别等距地设置若干波源,在它们的对边对等地安放同样多的接收器,记录弹性波由每个波源到达对边上每个接收器的时间,根据弹性波在介质中和在空气中不同的传播速度,来确定板内空洞的位置。Qj 现考察如下的具体问题: D C 一块240(米)×240(米)的平板(如图),在 AB边等距地设置7个波源P(i=1,„,7),CD边对等i 地安放7个接收器Q(j=1,„,7),记录由P发出的弹j i 性波到达Q的时间t(秒); 在 AD边等距地设置7jij 个波源R(i=1,„,7),BC边对等地安放7个接收器i S(j=1,„,7),记录由R发出的弹性波到达S的时间j ijRi τ(秒)。已知弹性波在介质和空气中的传播速度分ij 别为2880(米/秒)和320(米/秒),且弹性波沿板Sj 边缘的传播速度与在介质中的传播速度相同。 1)确定该平板内空洞的位置。 2)只根据由P发出的弹性波到达Q的时间ij t(i,j=1,„,7),能确定空洞的位置吗;讨论在同样能ijA B Pi 够确定空洞位置的前提下,减少波源和接受器的方 法。 tQQ Q Q Q Q Q ij 1 234567 0.0611 0.0895 0.1996 0.2032 0.4181 0.4923 0.5646 P1 0.0989 0.0592 0.4413 0.4318 0.4770 0.5242 0.3805 P 2 经管数学 0.3052 0.4131 0.0598 0.4153 0.4156 0.3563 0.1919 P 3 0.3221 0.4453 0.4040 0.0738 0.1789 0.0740 0.2122 P 4 0.3490 0.4529 0.2263 0.1917 0.0839 0.1768 0.1810 P 5 0.3807 0.3177 0.2364 0.3064 0.2217 0.0939 0.1031 P 6 0.4311 0.3397 0.3566 0.1954 0.0760 0.0688 0.1042 P 7 SS S S S S S τ1 234567ij 0.0645 0.0602 0.0813 0.3516 0.3867 0.4314 0.5721 R1 0.0753 0.0700 0.2852 0.4341 0.3491 0.4800 0.4980 R 2 0.3456 0.3205 0.0974 0.4093 0.4240 0.4540 0.3112 R 3 0.3655 0.3289 0.4247 0.1007 0.3249 0.2134 0.1017 R 4 0.3165 0.2409 0.3214 0.3256 0.0904 0.1874 0.2130 R 5 0.2749 0.3891 0.5895 0.3016 0.2058 0.0841 0.0706 R 6 0.4434 0.4919 0.3904 0.0786 0.0709 0.0914 0.0583 R 7 经管数学
本文档为【DNA序列分类】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_337177
暂无简介~
格式:doc
大小:47KB
软件:Word
页数:7
分类:农业
上传时间:2017-11-12
浏览量:42