首页 源於插入处的shortintactdirectrepeats-Sites

源於插入处的shortintactdirectrepeats-Sites

举报
开通vip

源於插入处的shortintactdirectrepeats-Sites基因體科學(8) 基因舞者 談基因體上的跳躍單元 Dancers in the Genome – Mobile elements 台灣大學謝豐舟教授 人類的基因體已知具有3X109鹼基對,其中屬於獨特序列(unique or single copy DNA意即整個基因體上只有一個copy)的部分約佔45%,另外55%則是反覆序列(repetitive sequence)。基因體中的主角當然是"基因",因此這些佔了基因體一半以上的反覆序列,一向被視為垃圾(Junk)DNA。 然而,這些"垃圾"真是如此不堪嗎?近...

源於插入处的shortintactdirectrepeats-Sites
基因體科學(8) 基因舞者 談基因體上的跳躍單元 Dancers in the Genome – Mobile elements 台灣大學謝豐舟教授 人類的基因體已知具有3X109鹼基對,其中屬於獨特序列(unique or single copy DNA意即整個基因體上只有一個copy)的部分約佔45%,另外55%則是反覆序列(repetitive sequence)。基因體中的主角當然是"基因",因此這些佔了基因體一半以上的反覆序列,一向被視為垃圾(Junk)DNA。 然而,這些"垃圾"真是如此不堪嗎?近來對基因體的研究,學者慢慢瞭解這些"反覆序列"不僅是建構基因體的重要成分,更是形塑"基因體"性狀和功能的基因體工匠(genome artisan)。 反覆序列的分類(圖1) 反覆序列可以分為兩大類,其一為串聯反覆序列(tandem repeat)。這是一些單位序列反覆地再現,缺乏具體的組織結構;它包括(1)微衛星(microsatellite):由2–10個鹼基的基本序列組成反覆數次到數十次,如(CA)n(2)迷你衛星(minisatellite):由20–100個鹼基的基本序列反覆組成,可達500–20,000個鹼基的長度(3)端粒序列(telomere)位於各染色體的遠端,其一般結構為5′–(T/A)1-4 (G)1-8–3′。 串聯反覆序列約佔人類基因體的10–15%,它們通常聚集在染色體上的某些區段,例如染色體1號、9號、16號的長臂近端以及Y染色體的長臂。在每一個染色體的中心粒都有稱為α–衛星(α–satellite)的反覆序列,這是以171個鹼基為基本單位的反覆序列,據信α–衛星與細胞分裂時染色體的分離(segregation)有關。串聯反覆序列有人將之統稱為衛星(satellite)DNA,原因是早期在研究DNA時,使用Cesium chloride density gradient進行離心,大部分的DNA(含前述的獨特序列DNA)自成一區,而這些串聯反覆序列DNA較輕,所以另外集合成較小的三區,恰似行星旁邊的衛星,因此習慣上以"衛星"來稱呼這些串聯反覆序列(圖2)。讀者要注意,此一"衛星"與acrocentric染色體(13,14,15,21,22號)上的"衛星"不同,後者是型態上像染色體頭上長出兩粒,性質上則是好幾百個copy的ribosomal RNA gene,與前述串聯反覆序列的"衛星"完全不同,不可混淆。 散落性反覆序列(Interspersed repetitive sequence)(圖3) 反覆序列的另一大類是"散落性反覆序列"(Interspersed repetitive sequence)。與前述聚合在某些染色體區段的串聯反覆序列不同的是,這些散落性反覆序列在染色體上到處分佈,因此稱之為散落性反覆序列。它包括兩大類,一類是DNA跳躍子(DNA transposon),另一類則為反轉錄單元(retroelement)。前者類似果蠅的跳躍子(transposon),在人類基因體較不重要;倒是反轉錄單元(retroelement),在哺乳類基因體結構上扮演相當重要的角色。它們都能藉由中介RNA(RNA intermediate)進行擴增(amplification),並且移動到基因體上的新位置,因此被稱為反轉錄單元(retroelement)或反轉錄跳躍子(retrotransposon),因為它們能在基因組上移動,也有人稱之為移動單元(mobile element),據估計人類基因體的50%是由反轉錄單元衍生而來。 反轉錄單元(retroelement)又可分為自主性反轉錄單元(autonomous)及非自主性反轉錄單元(non autonomous)。自主性反轉錄單元雖然需要許多細胞內蛋白質協助其擴增,但其本身確實具有一些擴增所需的活性,相反地,非自主性反轉錄單元則必須藉助其他的自主性反轉錄單元提供協助,才能達到其擴增的目的。 自主性反轉錄單元以LTR(long terminal repeat)最為知名,它的結構與反轉錄病毒(retrovirus)相類似。頭尾兩端是long terminal repeats,中間則為數個開放轉錄區(open reading frame)以轉譯反轉錄移位(retrotransposition)所需的蛋白質;包括endonuclease,以切入欲結合的基因體位置,還有reverse transcriptase俾將RNA轉錄成DNA。在第一個LTR正下游則有能提供反轉錄起始點的特別部位(priming site)。與反轉錄病毒不同的是,LTR缺少合成病毒套膜及製造功能性病毒基因的基因組。有時候LTR也會缺少某些ORF以致不能自行擴增,而成為非自主性反轉錄單元。它們通常是來自古老的反轉錄單位,失去部分功能後變成不活動的假基因(pseudogene)。 非自主性反轉錄單元主要有SINE(short interspersed repetitive element)及LINE(long interspersed repetitive element)。SINE長度約90–300個鹼基,其中最重要的是Alu,LINE長度約6,000個鹼基,最著名的是L1。 Don Quixote, 1955 by Pablo Picaso L1 retroelement 人類的基因體上有近50萬個不活動的L1單元(5′truncated,inverted or mutated),但仍有5,000個全長6Kb的L1存在而其中60–100個具有retrotransposition的能力。完 整的L1,全長6,000Kb,含有(1)5′未轉譯區(5′UTR)(內含1 promoter),(2)1Kb之開放轉錄序列(ORF1),能產生具RNA結合能力的蛋白質(3)4Kb之開放轉錄序列(ORF2),能產生具endonuclease及reverse transcriptase能力的蛋白質(4)短的3′UTR(5)poly(A)tail(圖3)。L1插入染色體DNA是藉由所謂target primed reverse transcription (TPRT)的過程,其ORF2的endonuclease先切斷一處單鏈DNA,以切斷處之3′–OH作為引子,並以L1 RNA作為模板(template)進行反轉錄。 L1在基因體上的retrotransposition可經由下列四種機轉改變基因結構 (1) Insertional mutagenesis(cis) L1產生的蛋白質會作用於L1本身轉錄出來的RNA以產生新的retrotransposition event。新形成的L1可以是full length,5′truncation或是5′truncation加上inversion (2) Insertional mutagenesis(trans) L1產生的蛋白質偶爾會作用於其他非L1RNA,造成processed pseudogene(佔genome的1%)或Alu這類nonautonomous retrotransposon(佔人類genome的10%,約共五十萬copy)的散佈於基因體上。所謂processed pseudogene就是一個spliced mRNA被L1的reverse transcriptase反轉錄成DNA,再插入基因體。 (3) Endonuclease independent insertion 在極稀少的情況下,L1也能直接插入到一處DNA之double-strand break,不過插入後之L1常常是3′truncated並且缺少TSD(target site duplication)。 (4) Transduction L1在進行retrotransposition時,會涉及3′或5′(較少見)之flanking DNA,並將之帶到基因體上新的位置,也就是L1  會扮演"exon shuffling"的工作。位於基因intron的L1,當它進行retrotransposition時,會把其上游或下游的exon帶到基因體上的新位置,可能就把這個exon加到一個新的基因內,造成基因體重要的改變。 總之,L1大概直接或間接與人類基因體的三分之一脫不了關係。 Alu retroelement 人類基因體上另一個重要的retroelement就是Alu,總共有50萬copy,佔人類基因體的10–15%。完整的Alu長度約300bp,因為它具有一處Alu I restriction enzyme的切點,因此被冠上Alu這個奇怪的名稱。Alu常見於intron,基因的3′UTR以及intergenic genome region 。雖然Alu是SINE中最主要的成員,但Alu較多見於基因組上基因豐富(gene-rich)的區域,而非隨意散落各處。 演化上,Alu出現的時間正是65百萬年前靈長類誕生的時候。仔細分析Alu的鹼基序列,我們可以推定它源於7SL RNA基因,而此基因是ribosomal complex的一部分。Alu可能源起於靈長類演化早期的一次gene duplication,繼而發生不斷的amplication,而達到今日龐大的數目。事實上,所有的SINE(short interspersed repetitive element)均源於各種小型且具高度結構性的RNA如tRNA(transfer RNA),其轉錄則有賴於RNA polymeraseIII。 Alu是由二個monomer組成,二個monomer之間夾著一段富含A的序列(A2TACA6)。在5′的第一個monomer,具有兩個RNA polymerase III的promoter,在3′的第二個monomer則帶有一個31bp的insertion。第二個monomer的末端則是不同長度polyA tail。在整個Alu的頭尾兩端則是源於插入處的short intact direct repeats。Alu 會經由retrotransposition 擴增其數量,此過程是由Alu上的RNA polymeraseIII promoter啟動反轉錄,由於Alu並不具有使RNA polymeraseIII 停止轉錄的訊號,因此轉錄常延伸到鄰接的獨特序列 (unique sequence) ,直到出現TTTT序列才停止下來。因此,Alu之RNA轉錄稿在3′常有UUU的序列。目前推測Alu的retrotransposition可能要先由前述的L1之endonuclease對插入處的DNA,在TTAAAA的consensus site上先予以切斷(first nick) ,然後Alu的poly A tail與切斷處3′的TTTT結合,再以Alu為模板進行反轉錄,目前另一接合處(second nick)的機轉尚待釐清,不過,反轉錄及插入完成後新的Alu兩端會帶有新的direct repeats。
本文档为【源於插入处的shortintactdirectrepeats-Sites】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_471618
暂无简介~
格式:doc
大小:23KB
软件:Word
页数:0
分类:
上传时间:2019-09-19
浏览量:13