首页 基于拟氨基酸编码方法的同义密码子的偏好性与结合强度的相关性研究

基于拟氨基酸编码方法的同义密码子的偏好性与结合强度的相关性研究

举报
开通vip

基于拟氨基酸编码方法的同义密码子的偏好性与结合强度的相关性研究基于拟氨基酸编码方法的同义密码子的偏好性与结合强度的相关性研究 第 58 卷 第 6 期 2009 年 6 月 物理学报Vol . 58 ,No . 6 ,J une ,2009 () 100023290Π2009Π58 06Π4295206 ACTA PHYSICA SINICA ν 2009 Chin. Phys. Soc . 基于拟氨基酸编码方法的同义密码子的偏好性与 3 结合强度的相关性研究 ) ) ))1211t朱平 高雷 徐振源 ) ( )1江南大学理学院 , 无锡 214122 ) ( )...

基于拟氨基酸编码方法的同义密码子的偏好性与结合强度的相关性研究
基于拟氨基酸编码方法的同义密码子的偏好性与结合强度的相关性研究 第 58 卷 第 6 期 2009 年 6 月 物理学报Vol . 58 ,No . 6 ,J une ,2009 () 100023290Π2009Π58 06Π4295206 ACTA PHYSICA SINICA ν 2009 Chin. Phys. Soc . 基于拟氨基酸编码方法的同义密码子的偏好性与 3 结合强度的相关性研究 ) ) ))1211t朱平 高雷 徐振源 ) ( )1江南大学理学院 , 无锡 214122 ) ( ) 2江南大学信息工程学院 , 无锡 214122 () 2008 年 6 月 19 日收到 ;2008 年 7 月 31 日收到修改稿 () 计算了基于拟氨基酸编码方法下的同义密码子的相对使用度 ,分析了 78 个人类基因 19967 个密码子中基于 拟氨基酸编码方法下的同义密码子的偏好使用情况. 石秀凡等的研究结果显示了人类基因中基于基因组基因编码 方法下 ,对同义密码子的选择在所有密码子家族中仍都呈现明显一致的偏好. 即偏好使用密码子2反密码子结合作 用强的密码子 ,恰好是以 c 结尾的密码子 ;且避免使用结合作用中度的密码子. 依据结果和数据分析 , 推测人类基 因对密码子的选择除了受基因组结构中 isochore 和基因签名的影响外 ,还和密码子2反密码子结合强度密切相关. 这些因素共同作用于人类基因 ,从而在所有密码子家族中都呈现出对同义密码子明显一致的偏好现象. 文中则是 展示了上述性质在拟氨基酸编码方法下 ,这些特征不但存在 ,而且更为明显. 关键词 : 拟氨基酸编码方法 , 同义密码子 , 偏好 , 人类基因 PACC : 8710 , 8715 , 0210 据文献 1 ,密码子的相对使用度运算公式如 下 :RSCU = 同义密码子的观测数Π同义密码子的期 11 引言 望数 ,期望数 = 氨基酸的观测数Π编码此种氨基酸的 同义密码子数目. 采用 4 种碱基分别出现在密码子 111 密码子的相对使用度 RSCU 1( ) 3’端的相对频率 RFN3’估测密码子第 1 位碱基对 编码同一个氨基酸的两个戒两个以上的密码子前一同义密码子的影响. 且对任一给定的同义密码 互称为同义密码子. 自遗传密码破译以来 ,研究者通 子 ,其后接碱基 N 的 RFN3’计算如下 : RFN3’ = 同 ( ( ) 过对原核生物和真核生物的基因编码序列的转录和 义密码子 后接 N的观测频率Π同义密码子 后接 ( ) ) 翻译功能的研究发现 ,同义密码子的使用不基因 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf N的期望频率 ,同义密码子 后接 N的观测频率 = ( ) 同义密码子 后接 N的观测数Π同义密码子的观测 达存在密切的关系. 不但不同生物体使用的偏好密 () 总数 ,同义密码子 后接 N的期望频率 = 该密码子 码子可能不同 ,甚至同一生物体内不同基因也有着1 ( ) 不同的密码子使用倾向,这些同义密码子的使用 家族所编码的氨基酸 后接 N的观测数Π该密码子 )( 直接戒者间接地影响着生物体内基因的转录 ,信使 家族所编码的氨基酸的观测总数. RSCU 戒 RNF3’ ( 的值大于戒等于戒小于 1 意味着该同义密码子 戒 RNA 的翻译 ,以及合成蛋白质的结构不活性. ) 近几年来 ,有学者试图应用数学 、物理等其他方 密码子的 3 ,4 位碱基的出现频率大于戒等于戒小 法从新的角度对遗传密码表进行诠释 ,幵取得了较 于期望频率 , 即所有同义密码子平均使用时的频 2 为令人信服的成果. 石峰 、莫忠息利用信息理论 , 率. 鉴于现有的人类 tRNA 的资料不足 , 文献 1 采 ( 对密码子的简幵度进行了分析 ,研究得出生物物种 用 Turner Group 公布的 http :ΠΠwww. ibc . wustl . eduΠ~ ) 越高级 ,该物种蛋白质氨基酸含量不其相应密码子 zukerΠrnaΠenergyΠ用于计算 RNA 折叠的自由能参数 简幵度的相关性就越大. 中的堆积能参数计算密码子2反密码子 Watson2Crick ( ( ) ) 3 科技部国际科技合作基金 批准号 : 2007DFA70670和江南大学创新团队发展计划 批准号 :2008CX002资助的课 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 . E2mail :zhuping @jiangnan. edu. cn ;zptl2002 @yahoo . com. cn t 码此种拟氨基酸的同义密码子数目.配对时的堆积能来衡量密码子2反密码子间的结合强 弱 ,幵且是用 C 语言编程完成全部的统计和计算.其中采用 4 种碱基分别出现在密码子 3’端的 () 我们对同一物种中不同基因组间和不同物种中 相对频率 QRFN3’估测密码子第 1 位碱基对前一 密码子用法进行一系列比较 ,以期发现密码子用法 同义密码子的影响. 对任一给定的同义密码子 , 其 的差异以及造成密码子偏好性的因素. 尽管由于密 后接碱基 N 的 QRFN3’计算如下 定义 3( ) 码子第三位上发生突变的概率要进进高于其他位 QRFN3’= 同义密码子 后接 N的观 ( ) 置 ,这些同义突变在构建系统发育树时经常被忽略 , 测频率Π同义密码子 后接 N的期望频率 , 同义密 (() ) 但是根据相近物种中密码子用法相似的理论 ,密码 码子 后接 N的观测频率 = 同义密码子 后接 N的 ( 子用 法 的 偏 好 性 可 以 作 为 聚 类 分 析 的 一 项 重 要 观测数Π同义密码子的观测总数 , 同义密码子 后接 指标. ) N的期望频率 = 该密码子家族所编码的拟氨基酸 () 后接 N的观测数Π该密码子家族所编码的拟氨基 121 拟氨基酸编码方法 1酸的观测总数. 20 世纪最有意义的成果之一就是密码子的成 3 131 78 个基因样本及其同义密码子的偏好 1功破译 ,但事实上 ,在 1991 年 ,Bock 等发现 ,在罕 见情形下 ,有的生物会用终止子翻译硒代半胱氨酸 ; 在文献 1 中 ,根据 RSCU 公式 ,再编制 C 语言 同时 ,文献4 ,5 表明 ,在某些古细菌和真细菌中 ,通 ( ) 程序 ,计算出来了 78 个人类基因 19967 个密码子常作为终止子的 UAG 可编码吡咯赖氨酸. 终止子编 中同义密码子的相对使用度 ,以及 4 种碱基在同义 码氨基酸的现象引发了人们重新诠释无义密码子的 密码子 3’端对终止密码子为其 5’端的相对出现频 6 思考,目前这其中的机理尚不清楚. 率以及密码子和反密码子相互作用的堆积能量 ,由 因此 , 基因组遗传密码字典自确立以来 , 在 40 文献1 中表 1 列出. 从中可见人类基因对同义密 年的科学研究中被不断的扩充和完善. 作为生命组 码子的选择有明显的偏好 , 幵在不同的密码子家族 成不可缺少的一个部分 ,该遗传密码显示出了它在 ) 中呈同一特征. 这种特征明显表现为 : 1在所有密 进化上的复杂性和适应性 ,但也充分地显示了人类 码子家族中 , 除了第 2 位碱基为 u 的家族外 , 相对 在遗传密码认识上的尿限性. 正因为这些原因 ,人们 使用度最高的密码子都是密码子2反密码子结合最 完全揭示遗传密码内在特性的道路还很漫长. 还需 强的. 表观特征为在所有包含以 c 结尾的密码子家 要进行不断的研究和尝试. 族中都是以 c 结尾的密码子 RSCU 值最高. 因为在 所有四密码子家族中 , 密码子2反密码子间的结合 因而 ,在文献7 中 ,从代数运算角度 ,我们提出 (强度不第 3 位碱基的关系为 c > g > a > u 当第 2 位 了如下拟氨基酸编码方法 : 7) ) 1 令 WC ? {tgg , tgt , tga , tgc} , RS?碱基为 c 时 , a = u; 2在第 2 位碱基为 u 的家族 定义 ( ? {ttg , ttt , tta , ttc} ,MI中 , 以 g 结尾的密码子 其结合能仅次于以 c 结尾 {agg , agt , aga , agc} , LF ? ) { atg , att , ata , atc} , ED ?{gag , gat , gaa , gac} ,的的相对使用度最高 , 以 c 结尾的次之. 在以 a 戒 - Y ? { tag , tat , taa , tac } , KN ? { aag , aat , aaa ,g 结尾的二密码子家族中 , 以 g 结尾的密码子的使 用率均明显高于以 a 结尾的密码子. 在观察单个基 aac} , QH ? { cag , cat , caa , cac } , S’? { tcg , tct , 因时 , 我们注意到 gc 丰富的不 gc 贫乏的基因呈现 tca , tcc} ,R’? {cgg , cgt , cga , cgc} , L’? {ctg , ctt , cta , ctc} . 不同的偏好 , 富含 gc 的基因更突出显示出偏好性. 令 ZU216 = { G , V , ED , A , WC , LF , - Y , S’, 如今实验已表明绝大部分人类基因富含 gc , 所以文 RS , MI , KN , T , R’, L’, QH , P} , 则 ZU 称为拟氨 献 1 指出 ,样本虽小 , 但其结果至少可代表绝大部 ( ) 基酸集 , 这里 , - Y 为新终止子 , 但是 tga ?WC 分人类基因密码子偏好的特征. 各类基因的偏好特 不是终止子. 征及其可能原因正是我们进一步研究的方向. 这恰好 满 足 文 献 8中 所 提 的 牛 线 粒 体 中 的 综上所述 ,由文献1 —21 可知 , 在人类基因组 中密码子2反密码子结合强度不同义密码子的偏好 情况. 定义 2QRSCU = 同义密码子的观测数Π同义可能密切相关. 它不基因组结构 isochore , 基因编码 密码子的期望数 , 期望数 = 拟氨基酸的观测数Π编对密码子的选择方向不是相悖 ,而是基本一致. 人类 4297 6 期 朱 平等 : 基于拟氨基酸编码方法的同义密码子的偏好性不结合强度的相关性研究 ) 基因集中在 gc 含量高的 H1 , H2 和 H3 isochore 中 , 密码子中同义密码子的使用数量 ,再根据定义 2 所 偏好使用以 c 戒 g 结尾的密码子 , 恰好是密码子2反 给出的 QRSCU 公式和定义 3 所给出的 QRFN3’公式 () 密码子结合强的密码子 , 这可能有助于保证翻译的 我们计算了 78 个人类基因 19967 个密码子中基于 正确性. 密码子2反密码子结合的强弱差别也可能 拟氨基酸编码方法下的同义密码子的偏好使用情况 10 —29 ( 被用于蛋白质翻译过程中的某种需要. 我们 如表 1 . 其中 QRFN3’为密码子 3’端后所接碱基 对 ) 终止密码子为其 5’端前一碱基的相对观测频率 , 正在根据文献 1 的思路 ,进行深一局的统计分析 , 以进一步验证该推测是否正确.表中能量为密码子2反密码子以 Watson2Crick 堆 积 能 ,其数据来源于文献1 . 21 结果不分析 (根据文献1所列出的 78 个人类基因 19967 个 表 1 基于拟氨基酸编码方法的同义密码子的偏好使用情况 3’2u 3’2c 3’2a 3’2g 拟氨基酸 密码子 密码子数 能量 QRSCU 数目 QRFN3’ 数目 QRFN3’ 数目 QRFN3’ 数目 QRFN3’ 1358 229 320 402 407 011686 12356 12960 12997 000总数 355 34 102 98 121 160 10457 015680 112193 019325 111373 - 61ggg - 5150 015538 110409 017901 016289 115086 G ggt 188 33 35 35 85 - 5170 017776 018311 018359 017294 114914 gga 264 37 52 57 118 - 6170 116230 ggc 113453 110089 112997 015026 551 125 131 212 83 总数 854 135 011581 213 012494 203 012377 303 013548 tgg 018300 017820 111785 111094 282 140 13208 37 55 79 111 - 51 tgt 017942 016248 014917 116960 WC 231 - 4130 110820 29 36 27 139 tga - 4150 011733 018549 119505 016822 016094 37 5 18 6 8 - 5150 114239 tgc 304 64 113318 104 113716 91 112593 45 014172 011689 012078 013022 013211 900 152 187 272 289 总数 018608 110177 111807 018917 227 33 48 81 65 140 10089 - 51agg - 4130 017244 017992 015610 015075 118532 RS agt 163 22 19 25 97 018674 014292 110116 114282 aga 157 23 14 48 72 - 4150 016978 112412 114452 111061 014852 - 5150 115689 agc 353 74 106 118 55 总数 661 124 160 161 216 011876 012421 012436 013268 015981 112696 018411 111494 - 5170 12405 cgg 205 123 63 42 77 111380 110676 014152 113066 89 - 4160 015386 19 23 9 38 cgt R’ 017353 016054 110264 114246 116 - 4180 017020 16 17 29 54 cga - 5180 115189 114017 019382 113249 015730 251 66 57 81 47 cgc 011783 012314 012627 013275 1374 245 318 361 450 总数 017312 110140 018833 112301 130 12329 - 42gtg 767 100 180 178 309 - 3110 015502 111276 018001 018257 112116 V gtt 189 38 35 41 75 - 3150 012940 110550 017700 111682 019976 gta 101 19 18 31 33 317 88 115568 85 111586 111 113327 33 013179 gtc - 4160 019229 总数 011840 012777 012279 013104 1163 214 323 265 361 016645 018648 110732 112661 - 3100 17876 ttg 229 028 55 56 90 - 1180 110972 014600 016208 017292 118582 LF ttt 319 27 55 53 184 017344 111678 111268 019142 - 2120 012545 tta 74 10 24 19 21 续表 3’2u 3’2c 3’2a 3’2g QRSCU 拟氨基酸 密码子 密码子数 能量 数目 QRFN3’ 数目 QRFN3’ 数目 QRFN3’ 数目 QRFN3’ - 3130 118607 114968 12579 11114 13930 541 149 189 1137 166 0总ttc 1248 223 011787 279 012236 357 012861 389 013117 数 426 120 13654 78 110247 71 017455 128 110504 149 111221 - 31atg 252 - 2100 018077 28 016218 61 110828 28 013884 135 117187 MI att ata 96 16 24 20 36 - 2140 013077 019327 111183 017283 112031 - 3150 115192 111925 111607 113349 014670 atc 474 101 123 181 69 011669 012726 012441 013165 1684 281 459 411 533 总数 018015 018884 019548 112356 987 132 239 230 386 120 13444 - 42ctg ctt 169 36 112766 51 111072 23 015576 59 111030 - 3100 014014 ’ L - 3140 012874 015943 112128 111513 019139 cta 121 12 40 34 35 - 4150 019667 407 101 114872 129 111629 124 112483 53 014114 ctc 总数 2334 371 011590 467 012001 668 012862 828 013548 - 4150 14584 019167 110043 110593 019871 1gag 851 124 171 258 298 - 3150 017009 015999 017576 015980 116403 ED 409 39 62 70 238 gat 110744 018741 019059 111136 486 - 3130 018329 83 85 126 192 gaa 113374 112665 112716 014794 - 4160 110077 588 125 149 214 100 gac 011741 012693 013036 012530 672 117 181 204 170 总数 tag 9 0 116501 013660 117569 0 4 1 4 - 3140 10536 0 019946 017554 015561 117968 - Y tat 231 40 47 39 105 - 2140 113750 - 2120 011786 111487 111138 017686 110541 taa 30 6 9 7 8 - 3150 213929 402 71 110144 121 111175 157 112865 53 015212 tac 总数 012045 012315 012660 012980 2000 409 463 532 596 018437 110495 110766 110004 - 3100 17040 aag 852 1147 207 244 254 019453 - 2100 015380 015781 015311 117839 KN aat 269 52 36 38 143 110779 018128 019904 111005 372 - 1180 017440 82 70 98 122 aaa 112346 112780 111271 015096 507 - 3110 110140 128 150 152 77 aac 011765 012426 012434 013375 1360 240 330 331 459 总数 018480 019962 111055 110061 120 10441 - 42695 104 168 187 236 cag 018883 016015 017107 115536 - 3120 015441 QH cat 185 29 27 32 97 110494 110430 017102 111523 - 3100 014765 caa 162 30 41 28 63 - 4130 019353 113721 cac 318 77 94 112182 84 110853 63 015870 011633 012339 012339 013689 1445 236 338 338 533 总数 014762 115201 016888 110995 180 14983 - 50gcg 180 14 64 29 73 019167 017850 015072 114857 A gct 354 53 65 42 194 - 5150 019799 016639 018070 017039 114590 - 5150 016893 gca 249 27 47 41 134 - 6170 118325 113134 110462 114595 015406 gcc 662 142 162 226 132 011683 012591 012530 013196 总数 826 139 214 209 264 tcg 018070 017624 012440 118927 81 180 13923 11 16 5 49 - 40 tct 018914 019825 015030 114648 - 4150 110654 S’ 220 33 56 28 103 tca 169 - 4150 018184 17 015978 39 018907 32 017483 81 114996 4299 6 期 朱 平等 : 基于拟氨基酸编码方法的同义密码子的偏好性不结合强度的相关性研究 续表 3’2u 3’2c 3’2a 3’2g QRSCU 拟氨基酸 密码子 密码子数 能量 数目 QRFN3’ 数目 QRFN3’ 数目 QRFN3’ 数目 QRFN3’ - 5170 117240 113020 11167 15986 12725 110356 78 103 144 31 总tcc 1153 245 012125 273 012368 270 012342 365 013166 数 113543 019115 015837 111363 139 160 14822 40 30 19 50 - 40acg T - 4130 018846 016459 110269 015526 115485 255 35 62 33 125 act - 4130 018153 017810 019345 017814 113577 aca 235 39 52 43 101 - 5150 118179 acc 524 131 111765 129 110397 175 114262 89 015365 011665 012180 012517 013637 总数 1009 168 220 254 367 ccg - 5170 14400 015411 111982 018231 112137 111 010 29 23 49 - 5140 111497 016627 111229 012877 115737 P cct 290 32 71 21 166 019240 017679 019706 111943 cca 221 34 37 54 96 - 5140 018761 - 6160 115342 114278 019836 116013 013978 ccc 387 92 83 156 56 ) 表 1 列出了基于拟氨基酸编码方法下的 78 个 在此分类中 ,更加发现超 1 的没有以 a 结尾 2 () 人类基因 19967 个密码子中同义密码子的相对使 的 ,即得出以 a 结尾的密码子是最不偏好使用的 ,虽 用度. 由表 1 可见人类基因对同义密码子的选择有 有个别 QRSCU 分类有误差 ,但偏好性仍是以 c 结尾 明显的偏好 , 幵在不同的密码子家族中呈同一特 的最高 ,否则 ,若第二位为 a ,t 时 ,以 g 结尾的最高 ,c ) 征. 这种特征明显 表 现 为 : 1在 所 有 密 码 子 家 族 次之. 同时 ,不密码子2反密码子间的结合强度也密 中 切相关 , 除了{V ,L’, KN ,QH} 家族外 , 相对使用度最高 ,从而充分说明此分类具有较强的合理性. ) 的密码子都是密码子2反密码子结合最强的. 其表现 3第二位为 g 的拟氨基酸{ G ,WC , RS , R’} 均以 特征为在所有包含以 c 结尾的密码子家族中都是以 Ngc 的 QRSCU 为最高 , Ngg 的 QRSCU 为次之 ,同时 , ) c 结尾的密码子 QRSCU 值最高. 2在 {V ,L ’, KN , 恰好其 Ngc 的密码子2反密码子间的结合能量也为 (QH}最高 家族中 , 以 g 结尾的密码子 其结合能仅略次于 ,Ngg 的密码子2反密码子间的结合能量也为次 ) 以 之c 结尾的的相对使用度最高 , 以 c 结尾的次之. . 1) 4第二位为 c 的拟氨基酸{A , S’, TP} 均以 Ncc 可以看出原来关于氨基酸分类中的各种性质 均基本保证外 ,还具备更强的偏好使用度如下 :的 QRSCU 为最高 , Nct 的 QRSCU 为次之 , 同时 , 恰 ) 1关于碱基分 6 种情况 :好其 Ngc 的密码子2反密码子间的结合能量也为最 ( ) 高 , Ncg 的密码子2反密码子间的结合能量为次之 , c ??g ?a ?t ,有{ G ,R′} ; ( ) 但 Nct 的密码子2反密码子间的结合能量仅略低于 ?c ?g ?t ?a ,有{WC ,RS ,MI} ; ( ) Ncg. ?g ?c ?t ?a ,有{QH ,V ,L′} ; 该结果充分验证了拟氨基酸分类在理化性质上 ) ( Y} ; ?c ?t ?a ?g ,有{A ,S′,T ,P , - 是充分显现的 ,且同义密码子的偏好不密码子2反密 ( ) ?c ?t ?g ?a ,有{LF} . 码子间的结合强度更加密切相关 ,因而本文结论也 ( ) ?g ?c ?a ?t ,有{ ED , KN} . 充分 说 明 了 拟 氨 基 酸 编 码 方 法 更 具 合 理 性 和 科 特别值得一提的是 ,第二位为 a 的原来多为二 学性. 密码子集 ,现在合幵成了四密码子集. 1 ] 3 ] Shi X F , Huang J F , Liang C R , Liu S Q , Xie J , Liu C Q 2000 Trends Bock A , Forchhammer K , Heider J , Baron C 1991 ( ) Biochem . Sci . 16 463 Chin. Sci . B ull . 45 2520 in Chinese[ 石秀凡 、黄京飞 、梁宠 Hao B , Gong W M , Ferguson T K , James C M , Krzycki J A , Chan 4 ] 荣 、柳树群 、谢 君 、刘次全 2000 科学通报 45 2520 ] M K 2002 Science 296 1462 2 ] ( ) Shi F ,Mo Z X 2001 J . Math . PRC21 65 [ 石 峰 、莫忠息 5 ] 2001 数学杂志 21 65 ]Srinivasan G , James C M , Krzycki J A 2002 Science 296 1459 ( Ming Z H , Zhong L R 2002 Prog . Biochem . Biophys . 29 831 in J . Mol . Biol . 188 555 6 ] 15 ] Shpaer E G 1986 ) Chinese[ 明镇寰 、钟立人 2002 生物化学不生物物理进展 29 Bernardi G 1995 Annu . Rev . Genetics 29 445 16 ] 831 ] Xie T , Ding D 1998 FEBS Lett . 434 93 17 ] Zhu P , Tang X Q , Xu Z Y 2009 Chin . Phys . B 1 363 Oresic M , Shalloway D 1998 J . Molecular Biology 281 31 7 ] 18 ] Komar A A , Lesnik T 1999 FEBS Lett . 462 287 19 ] Chen W C , Chen Z H , Wang Z Q , Liu W , Zuo L 2002 Acta 8 ] Biophysinica 18 87 Liu X L , Xu H , Ma S S , Deng C S , Guo A M 2006 Acta Phys . 20 ] () Sin . 55 5562 in Chinese[ 刘小良 、徐 慧 、马松山 、邓超生 、 Karlin S , Mrazek J 1996 J . Mol . Biol . 262 459 9 ] Campbell A , Mrazek J , Karlin S 1999 Proc . Natl . Acad . Sci . 郭爱敏 2006 物理学报 55 5562 ] 10 ] USA 96 9184 Wei Z Y , Zang L H , Li M , Fan W , Xu YJ 2005 Acta Phys . Sin . 21 ] () 54 4955 in Chinese[ 魏志勇 、臧黎慧 、李 明 、范 我 、许玉杰 Shi X F , Huang J F ,Liu S Q , Liu C Q 2002 Prog . Biochem . 11 ] () Biophys . 29 411 in Chinese[ 石秀凡 、黄京飞 、柳树群 、刘次全 2005 物理学报 54 4955 ] 2002 生物化学不生物物理学进展 29 411 ]Hornos J E , Hornos Y M 1993 Phys . Rev . Lett . 71 4401 22 ] Chen Z H , Chen W C , Qiu H X , Wang Z Q 2001 Acta Biophysica Joseph J , Sasikumar R 2006 BMC Bioinf ormatics 7 243 12 ] 23 ] ( ) Sinica 1 187 in Chinese [ 陇 志 华 、陇 惟 昌 、邱 红 霞 、王 自 强 Holm L , Sander C 1999 Nucleic Acids Reserach 27 244 24 ] 2001 生物物理学报 1 187 ]Liu T , Wang Y , Wang K L 2007 Chin . Phys . 16 0272 25 ] Yan X L , Dong R X 2007 Chin . Phys . 16 2062 13 ] 26 ] Gu W J , Ma J M , Zhou T , Sun X , Lu Z H 2002 Acta Biophysica () Ma S S , Xu H 2007 Chin . Phys . 16 0862 Sinica 18 18 in Chinese[ 顾万君 、马建民 、周 童 、孙 啸 、陆 27 ] Xie P ,Dou S X , Wang P Y 2006 Chin . Phys . 15 0536 祖宏 2002 生物物理学报 18 18 ] 28 ] 14 ] Ohno S 1998 Proc . Natl . Acad . Sci . USA 85 9630 Clay O , Caccio S , Zoubak S 1996 Mol . Phylogenet Evol . 5 2 29 ] Co rrelatio n betwe e n t he u s a ge de gre e of t he syno nymo u s co do n a nd t he stre ngt h of co mbinatio n ba s e d o n t he 3qua si2a mino a cid co ding ) ) ))12 11tZhu PingGao Lei Xu Zhen2Yuan )) ( 1School of Science , Jiangnan University , Wuxi 214122 , China ) ( ) 2School of Inf ormation Engineering , Jiangnan University , Wuxi 214122 , China ( )Received 19 J une 2008 ; revised manuscript received 31 J uly 2008 Abstract The relative usage degree of the synonymous codon is computed and the use of preferences of the synonymous codon in 78 ( ) human genes 19967 codonsis analysed based on the quasi2amino acids coding. The results of Shi Xiufan et al . show that human genes clearly show the consistent preference in synonymous codon choice in all codon family based on the genomic genetic codes. That is , human genes prefer to use the codons with strong combination of the codon2anticodon , the codons ending with c , so that the use of the codons with moderate combination is avoided. The choice of codon in human genes is not only affected by the isochore and genome in the genome structure , but also related to the strength of combination with the codon2anticodon. All the above- mentioned factors affect the human genes ,and so all the codon families clearly show the consistent preference to the synonymous codon. This study shows that the above- mentioned characteritics are more obvious when the method of quasi2amino acids coding is used. Key words : quasi2amino acids coding , synonymy codon , usage degree , human genes PACC : 8710 , 8715 , 0210 ( 3 Project supported by the International Science and Technology Coorperation Program of Ministry of Science and Technology of China Grant No . ) ( ) 2007DFA70670and PIRT of Jiangnan University , China Grant No . 2008CX002. t E2mail :zhuping @jiangnan. edu. cn ;zptl2002 @yahoo . com. cn
本文档为【基于拟氨基酸编码方法的同义密码子的偏好性与结合强度的相关性研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_219945
暂无简介~
格式:doc
大小:43KB
软件:Word
页数:0
分类:生活休闲
上传时间:2017-09-26
浏览量:25