分子生物学笔记完全版
第一章 基因的结构
第一节 基因和基因组
一、基因(gene)
是合成一种功能蛋白或 RNA分子所必须的全部 DNA序列.
一个典型的真核基因包括
①编码序列—外显子(exon)
②插入外显子之间的非编码序列—内合子(intron)
③5'-端和 3'-端非翻译区(UTR)
④调控序列(可位于上述三种序列中)
绝大多数真核基因是断裂基因(split-gene),外显子不连续。
二、基因组(genome)
一特定生物体的整套(单倍体)遗传物质的总和,
基因组的大小用全部 DNA的碱基对总数表示。
人基因组 3X1 09(30亿 bp),共编码约 10万个基因。
每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-value
Paradox)。
人类基因组
计划
项目进度计划表范例计划下载计划下载计划下载课程教学计划下载
(human genome project, HGP)
基因组学(genomics),结构基因组学(structural genomics)和功能基因组学(functional
genomics)。
蛋白质组(proteome)和蛋白质组学(proteomics)
第二节 真核生物基因组
一、真核生物基因组的特点: ,
①真核基因组 DNA在细胞核内处于以核小体为基本单位的染色体结构中.
②真核基因组中,编码序列只占整个基因组的很小部分(2—3%),
二、真核基因组中 DNA序列的分类 •
(一)高度重复序列(重复次数>lO5)
卫星 DNA(Satellite DNA)
(二)中度重复序列
1.中度重复序列的特点
①重复单位序列相似,但不完全一样,
②散在分布于基因组中.
③序列的长度和拷贝数非常不均一,
④中度重复序列一般具有种属特异性,可作为 DNA标记.
⑤中度重复序列可能是转座元件(返座子),
2.中度重复序列的分类
①长散在重复序列(long interspersed repeated segments.) LINES
②短散在重复序列(Short interspersed repeated segments) SINES
SINES:长度<500bp,拷贝数>105.如人 Alu序列
LINEs:长度>1000bp(可达 7Kb),拷贝数 104-105,如人 LINEl
(三)单拷贝序列(Unique Sequence)
包括大多数编码蛋白质的结构基因和基因间间隔序列,
三、基因家族(gene family)
一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同
祖先基因(ancestral gene)经重复(duplication)和突变产生。
基因家族的特点:
①基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因(tandemly
repeated
genes),如 rRNA、tRNA和组蛋白的基因;
②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;
③有些成员不产生有功能的基因产物,这种基因称为假基因 (Pseudogene).
Ψa1表示与 a1相似的假基因.
假基因分类。加工过的假基因(processed pseudogene)。
典型的基因家族
1.tRNA基因
单倍体人基因组中 1300个 tRNA基因,tRNA基因簇.
2.rRNA基因
>l00copy.rRNA基因簇(重复单元 28S、18S、5.8s-rRNA)
3.组蛋白基因
30-40copy.定位:7q32-q36
组蛋白基因簇(重复单位:H1,H2A,H2B,H3、H4)
特点:无 intron,Poly(A)- RNA.
4.珠蛋白基因
α类:16p13,基因簇(24Kb):5’—ζ—Ψζ—Ψα1—α2—α1—3’
β类:11p15,基因簇(60Kb):5’— ζ—Gr—Ar—Ψβ—δ—β—3’
四、超基因家族(Supergene family ,Superfamily)
由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同.
五、人类基因组中的重复序列标记
1、A1u序列
单倍体人基因组 50万-100万拷贝,平均每隔 3-6Kb就有一个 Alu序列,
人 A1u序列长 300bp:
2X130bp重复序列;
+31bp间隔序列(中间);
两侧 7-21bp正向重复(direct repeats),返座子?
Alu序列广泛散布于人基因组,约 90%巳克隆的人基因合有 Alu序列
Alu序列标志。
2、可变数串联重复 • , •
Variable number tamdem repeat, VNTR.
又称小卫星 DNA(minisatellite DNA)
由短重复单位(6-40bp)串联重复(6-100次以上)而成,多位于基因的非编码区,广泛分布。
VNTR多态性—分子标记—DNA指纹图(fingerprint).
小卫星 DNA突变与肿瘤,H-Ras。
3、短串联重复(short tandem repeat,STR)
又称微卫星 DNA(microstallite DNA)
2-6 个核苷酸组成的重复单位串联重复(10-60 次),两侧为特异的单拷贝序列,人基因组中每
l0kb
DNA序列至少一个 STR序列。
{CA)n,50,000-100,000拷贝.
新一代遗传标记,人类基因组研究,肿瘤,遗传病.
第三节 线粒体基因组
人线粒体基因组的特点:
1、人线粒体基因组为 16,569bp 的双链闭环分子,一条链为重链(H 链),一条链为轻链(L
链),两条链均有编码功能,每个 mtDNA分于编码 13种蛋白质和 24种结构 RNA(22rRNA,
2tRNA).
2、线粒体 DNA为母系遗传.
3、结构基因不含内含子,部分区域有基因重叠,因此病理性 mtDNA突变更易发生.
4、mtDNA突变频率更高.
5、线粒体 DNA突变的表型表达与核 DNA不同。
第四节 细菌和病毒基因组
一、细菌基因组的特点。
1.功能相关的几个结构基因往往串联在—起,受它们上游的共同调控区控制,形成操纵子
结构,
2.结构基因中没有内含子,也无重叠现象。
3.细菌 DNA大部分为编码序列。
二、病毒基因组的特点
1.每种病毒只有一种核酸,或者 DNA,或者 RNA;
2.病毒核酸大小差别很大,3X103一 3X106bp;
3.除逆病毒外,所有病毒基因都是单拷贝的。
4.大部份病毒核酸是由一条双链或单链分子(RNA或 DNA),仅少数 RNA病毒由几个核酸
片段组成.
5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子.
6.有重叠基因.
第五节 染色质和染色体
细胞分裂间期—染色质(chromatin)
分裂期—染色体(chromosome)
一、染色质的基本单位—核小体
(一)核小体(nucleosome)结构
DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外 1.8周(146bp),形成核小体核心
颗粒。
两个核小体核心颗粒之间有 Linker DNA(0-80bp),
核小体核心颗粒+Linker=核小体(长 180-210bp)
核小 体 DNA Ladder.
(二)组蛋白(histone):一类小的带有丰富正电荷<富含 Lys,Arg)的核蛋白,与 DNA有高亲和
力.
组蛋白分类:
1.核小体核心组蛋白,H2A,H2B,H3,H4。分子量较小(102-135aa)
作用:盘绕 DNA形成核小体 。
2.H1组蛋白:较大(220aa),作用:与 Linker DNA结合后利于核小体稳定和更高级结构的
形成•
。
二、染色质的高级结构
1、30nm染色质纤丝 ,
2、袢环结构(looped domain) 。
3、细胞分裂期染色体
分裂期染色体=一对姐妹染色单体(Chromatid)
有丝分裂中期 46 条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型
(Karyotype)
三、染色体的结构要素 。
(一).着丝粒(centromere):细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分
离所必需。
(二).端粒(telomere):真核生物线状染色体分子末端的 DNA区域
端粒 DNA的特点:
1、由富含 G的简单串联重复序列组成(长达数 kb).
人的端粒 DNA重复序列:TTAGGC。
2、端粒的末端都有一条 12-16碱基的单链 3’端突出。
端粒的作用:防止 DNA末端降解,保证染色体的稳定性和功能
第二章 DNA的复制、修复和重组
第一节 DNA的复制(DNA Replication)
一、DNA复制的基本特性
1. 半保留性(Semi-Conservative)
Meselson-Stahl实验
2. 双向复制(一般)
复制起始点(origin)+两侧复制叉=复制单位(复制子, Replicon)
3.半不连续性(Semi-discontinuous)
前导链(leading strand)-连续合成
随从链(Lagging Strand)-不连续,由岗崎片段(okazaki fragment)连接而成.
二、DNA复制必需的成份(真核生物)
1.染色体 DNA复制必需三种核苷酸序列①复制起点②着丝粒③端粒.
2. RNA引物(RNA Primer)
一般 8-14nt.带游离 3'-OH形成磷酸二酯键.
④DNA解链酶(DNA Helicase),打开 DNA双链.
⑤增殖细胞核抗原(Proliferating cell nuclear antigen.PCNA)
辅助催化前导链合成.
⑥端粒酶(Telomerase)
末端复制问题。
端粒酶负责染色体末端(端粒)复制,是由 RNA和蛋白质组成的核糖核蛋白.其中的 RNA成分
是端粒复制的模板.(因此端粒是逆转录酶)
作用:维持端粒长度.
端粒酶活性可用基于 PCR的“TRAP”(Telomerase repeat amplification
protocol)法测定(Kim,N et al.,science,266,2011-2014(1994)
端粒与细胞寿命。
端粒、端粒酶与肿瘤的关系:绝大多数恶性肿瘤具有端粒酶活性但端粒缩短,但也有约 5%
的肿瘤无端粒酶活性且端粒较长。
端粒酶作为新的肿瘤标志和肿瘤治疗靶点.
第二节 DNA修复(DNA repair)
DNA 修复是维持基因组完整性的重要机制,在保护基因组避免发生可能导致肿瘤或遗传疾
病的突变中起关键的作用。
引起 DNA损伤的因素:
1、 细胞内源性损伤因素:
DNA复制错误;自发损伤包括碱基互变异构、碱基脱氨(C→U、A→I)和碱基丢失等;氧
化代谢副产物如活性氧物质(Reactive
oxygen species,ROS)的攻击等。
2、 环境中的损伤因素:
辐射(含紫外线、X射线)产生胸腺嘧啶二聚体;化学致癌物(氧化脱氨,烷化剂或代谢活
化物如苯并芘、黄曲霉素等产生碱基加合物)
一、碱基切除修复(Base excision repair、BER)
该途径中最关键的是必须通过一种糖苷酶(glycosylase)先除去变异碱基(如被氧化、烷基化或
脱氨的碱基),该糖苷酶催化连接损伤碱基与脱氧核糖之间的糖苷键水解,释放游离碱基并
在 DNA 中产生一个去碱基位点,然后由去嘌呤/去嘧啶(AP)核酸内切酶、DNA 聚合酶和
DNA连接酶等利用相对的一条正常链为模板进行修补合成。
BER途径中的重要糖苷酶:
(1)尿嘧啶 DNA糖苷酶(UDG),从 DNA中除去尿嘧啶碱基;
(2)3—甲基腺嘌吟(3MeA)DNA糖苷酶,可修复烷化剂产生的损伤;
(3)负责修复 DNA氧化损伤的糖苷酶(如 Fpg/MutM DNA糖苷酶)
BER是修复内源性 DNA损伤(自发水解、烷基化和活性氧攻击)的主要途径,因此对于降低
自发突变的频率、防止肿瘤发生有重要作用。
二、核苷酸切除修复(Nucleotide excision repair,NER)
首先由多聚体复合物识别损伤,再在损伤的两侧进行切除。随着 DNA链被解开,包含损伤
的单链片段释放出来,留下的缺口由 DNA 聚合酶填补,DNA 连接酶封闭。该途径包括 20
种以上蛋白,可以修复紫外辐射诱导的环丁烷嘧啶二聚体(CPD)和(6—4)光产物((6—4)PPs),
以及一些化学物质产生的大加合物。
人的 NER系统有关基因及其蛋白质产物功能。
NER系统缺陷与着色性干皮病(Xeroderm pigmentosum,XP)
NER可再分为二条子途径:
(1)全基因组修复(Global Genomic
repair,GGR)途径:修复整个基因组内的损伤,其效率取决于损伤的化学特性、损伤部位的
DNA序列和染色质结构。
(2)转录藕联修复(Trancsription—coupled
repair,TCR,):特异地修复基因组中具有转录活性(即表达)的基因的被转录 DNA链上的损
伤,该途径的
特点是依赖 RNA聚合酶 II催化的转录,其中的一些蛋白是普通转录因子 TFIIH 的亚基。
三、错配修复(Mismatch repair)
负责修复 DNA复制过程中由于错误掺入而产生的错配。
STR序列复制-模板链的滑动产生小的环状突出(loop)-
重复序列扩张(expansion)或丢失:微卫星不稳定性(microsatellite instability)
E
coli中的 MMR途径需要 mutS,mutH,mutL和 uvrD基因产物和特异性核酸外切酶、DNA聚
合酶和 DNA连接酶等。在酵母和人类已鉴定了 mutS,mutH的多种同源物。遗传性非息肉性
结肠癌(HNPCC)基因缺陷。
微卫性不稳定与肿瘤。新的肿瘤基因诊断标志。
四、重组修复(Recomhinant repair)
修复 DNA的两条链均受损伤的部位的双链断裂或链间交连。
Further readings:
1 Wood RD,DNA repair in eukaryotes,Ann Rev
Biochem,1996,65:135—167
2 Krokan HE,et a1., DNA glycosylase in the base excision
repair of DNA.Biochem J,1997,325:1—16
3 Vrieling H,et a1., Transcription coupled repair and its impact
on mutagenesis,Mutation Res,1998,400:135—142
第三节 重组(recombination)
重组的本质是基因的重排或交换.即 2个DNA分子间或一个DNA分子的不同部位间,通过断
裂和重接,交换 DNA片段从而改变基因的组合和序列.
一.同源重组(Homologous recombination)
指 DNA同源序列间的重组,常发生于两个较长的同源 DNA片段或同源染色体之间。
可通过同源重组将外源基因定位整合到细胞基因组中.
二.转座(transposition)
可移动的 DNA元件(mobile DNA elements)
-转座元件(Transposable element).它是指那些可在 DNA分子内
或 DNA分子间转移的 DNA片段.
转座元件的转移过程-转座
转座的特点:
1.转座后原来位置的转座元件序列仍然保留,但同时又把新合成的 DNA 复本插入到另
外一个位点.
2.转座过程需要转座酶(transposase).它催化断裂和重接两步连续的 过程(需要M2+)
3.转座元件插入位置的两茶有 3-12bp 的正向重复序列(靶序列),它是由于转座酶错位切割
DNA造成的.这种短正向重复序列是存在转座元件的特征.
转座元件的分类
①转座子(transposon):通过 DNA复制而转移的转座元件.
②逆转座子(retroposon)或返座子,通过 RNA 阶段实现转移的转座元件 (DNA→ RNA→
DNA→
插入新位点)
逆转座子例:Alu.LINE1.逆假基因(retro-pseudogene)
转座的遗传效应-导致基因重排、插入、缺失。
第三章 基因表达的调控
基因表达:DNA→mRNA→蛋白质的遗传信息传递过程
基因表达的调控
第一节 基因的活化
基因的“开关”-染色质的活化
一、活性染色质的结构
间期核染色质:
异染色质(heterochromatin),高度压缩(不转录);
常染色质(euchromatin),较为松散,
常染色质中约 10%为活性染色质(更开放疏松)。
活性染色质→←非活性染色质
二、活性染色质的结构特点
(一)DNaseI敏感性
转录活性(或有潜在转录活性)的染色质对 DNase I更敏感.
DNase I超敏感位点(DNase I HyperSensitive Sites,DHSS)
(二)组蛋白 H3的 CyS110上巯基暴露,
三、活性染色质结构的形成
(一)、核小体位相(Phased positioning)
1.核小体的旋转定位(rotational positioning)
指核小体核心与 DNA 双螺旋在空间结构中的相互关系,主要包括 DNA 双螺旋的大沟是面
向还是背向核心结构. ‘
2.核小体的平移定位(translational positioning)
指核小体与特定 DNA 序列的结合位置和方式,特别是转录活性相关的 DNA 调控元件(启
动子、增强子等)序列与核小体的相互位置关系。
(二)、组蛋白修饰
1.H1组蛋白磷酸化
促进染色体包装,影响转录活性,
2.核心组蛋白修饰
乙酰化:常发生在组蛋白的 Lys,
一般活性染色质是高度乙酰化的。
(三)HMG蛋白结合
HMG(high mobility group)蛋白—高迁移率蛋白, 如 HMG14/HMG17.
与核小体核心颗粒结合,有利转录。
四、DNA甲基化与基因表达 .
(一)、真核生物基因组 DNA的甲基化(Methylation)
哺乳动物基因组中 5%的 C为甲基化(m C),mC主要存在于 CpG二核苷酸中.
CpG二核苷酸序列常成簇聚集并零散地分布于人基因组中,形成 CpG岛(CpG
islands).人基因组中约每 10Kb就有一个 CpG岛.
CpG岛常与基因相连(可作为寻找基因的标记)。
(二)DNA甲基化的转录抑制作用。
基因表达与甲基化呈负相关
基因甲基化状态:
1、高度甲基化: 基因为持续失活(如女性的一条 X染色体;
2、诱导去甲基化:如组织或发育阶段特异性表达基因;
3、持续低水平甲基化:具有转录活性(如持家基因)。
持家基因(housekeeping gene):
是指对所有类型组织细胞在任何时候都需要其表达的基因,通常都是维持细胞基本生存所必
须的基因,其表达常保持在固定的水平。又称为组成性基因(Constitutive
gene)。
(三)甲基化与基因组印迹
基因组印迹(genomic imprinting):指基因表达活性只局限于来自双亲之一的基因版本。
被印迹(imprinted)的基因.
基因组印迹的机制--DNA高度甲基化
基因组印记与肿瘤.
第二节 转录水平的调控
转录水平的调控是基因表达调控中最重要的环节。
一、真核基因转录基本条件:
特异性基因转录的基本条件包括:
①启动子(特别是核心启动子)
②转录模板(转录起始点(+1)---终止点)
③RNA PolⅡ
④普通转录因子(GTFs)
(一)启动子(promoter)
与基因转录启动有关的一组 DNA序列,一般位于 RNA
poII转录起始点上游 100-200bp以内,其功能是决定转录的起始点和调控转录频率.
启动子区域包括核心启动子和启动子上游近侧序列:
1、核心启动子(core promoter)
是决定转录起始位置的关键序列,也是普通转录因子 TFⅡD的结合位点,
①TATA盒(TATA box) 位于转录起始点上游-25~-30bp.
②起始子(initiator,Inr) Inr是与转录起始位点重叠的短的较保守序列.
注:①不是所有基因都含有 TATA盒或 Inr序列.有的只有其中之一,有的两者都无.
②这些核心启动子的序列和它们之间的间隔多变
2、上游启动子元件(Upstream Promoter element,UPE)
位于较上游(-30 一-110bp),能较强影响转录起始的频率,如 CAAT 盒和 GC 盒.其中 GC
盒是转录因子 SPl的结合位点。
(二)RNA聚合酶Ⅱ
负责真核生物蛋白编码基因的转录(产物 mRNA),有 7-10 个亚基,最大亚基的羧基末端结
构域(CTD)具有 7个氨基酸(Tyr-Ser-Pro-Thr-Ser
-Pro-Set)的重复序列,其中有多个磷酸化位点.CTD磷酸化对调控基因转录有重要作用.
(三)基础转录因子(basal transcription factor)
真核基因转录除 RNA聚合酶外还需要许多蛋白因子—转录因子参加,其中一些转录因子是
RNA 聚合酶Ⅱ转录起始必需的,并且可以维持基础水平的转录,因此称为基础转录因子或
普通转录因子(general
transcription factor)
1.RNA聚合酶 II的普通转录因子(TF II)
包括 TFIID,TFⅡB,TFIIF,TFIIE,TFIIH,TFIIA等.
TFIID是由 TATA盒结合蛋白(TATA binding protein,TBP)和 8种 TBP协同因子(TBP
associated factor,TAF)组成的复合物,TFIID可识别和结合核心启动子(TATA盒和 Inr);
TFⅡB的 C端与 TFIID和 DNA的复合物结合,N-端与 TFⅡF协同作用募集 RNA聚合酶 II,
再加上 TFIIE,TFIIH形成完整的转录复合物.
TFIIH有蛋白激酶活性,可使 RNA Pol最大亚基 CTD磷酸化,使转录起始过渡到转录延伸.
TFIIA有助于 TFIID与 TATA盒核心启动子结合.
2、TAF的作用
TFIID中包括至少 8种 TBP协同因子,分子量为 30—250kD,分别命名为 TAFⅡ-30~250.
TAFⅡ150识别起始子(1nr)序列.
TAF是基因转录调控的辅助因子,它的作用是通过与多种转录调控因子(激活物或阻遏物)
的转录调控结构域结合,而介导转录激活或抑制。
二、基因转录的顺式调控元件
顺式调控元件(cis-regulating
element)是指对基因表达有调控活性的 DNA序列,其活性只影响与其自身同处于一个 DNA
分子上的基因.
顺式调控元件中的短核心序列:共有序列或一致序列(consensus sequence)。
(一)启动子(promoter)
(二)增强子(enhancer)
能显著提高基因转录效率的一类顺式调控元件(其核心序列常为 8-12bp).
增强子的作用特点:
1.能(通过启动子)提高同一条链上的靶基因转录速率;
2.增强子对同源基因或异源基因同样有效;
3.增强子的位置可在基因 5’-上游、基因内或 3’下游序列中;
4.自身没有 5’-或 3’-方向性;
5.增强子可远离转录起始点(最多 30Kb);
6.增强子一般具有组织或细胞特异性.
(三)负调控元件—沉寂子
负调控元件是能抑制基因表达的序列.如沉寂子(silencer)
(四)其它顺式调控元件
1.应答元件(responsive elements)
真核细胞中对某些特定的环境作出应答的基因,常具有相同的顺式元件—应答元件.
应答元件能被在一些特定情况下表达的调控因子识别(又称为可诱导的顺式调控元件/反式
作用因子)。
2.转座元件对基因表达的调控, 。
三、基因转录的反式作用因子
转录水平的调控主要是通过与多种 DNA元件结合的蛋白因子来实现.
反式作用因子(trans-acting factor)是通过识别和结合顺式调控元件的核心序列而调控靶基因
转录效率的一组蛋白质.
反式作用因子对基因表达的调控可正(激话)可负(阻遏).
(一)反式作用因子的结构:
结构域(domain)是指蛋白质中可以具有独立的超二级结构的部分。通常由一个基因外显子编
码,并可具有特定的功能。在较大的蛋白质中,
多个结构域间可通过较短的多肽柔性区互相联接.
基序(motif):一般指构成任何一种特征序列的基本结构.作为结构域中的亚单元,其功能是
体现结构域的多种生物学作用.
1.反式作用因子的 DNA结合结构域(DNA binding domain)中的几种常见基序:
①螺旋/转角/螺旋(Helix-turn-helix,HTH)基序
两段螺旋被一短的转角结构分开,其中一段螺旋为 DNA识别螺旋.
同源异形结构域(Homeodomain,由同源异形盒编码)中含有 HTH 基序。具有 Homeodomain
的转录调控蛋白在胚胎发育和正常细胞分化的基因表达调节中有重要作用。
②锌指(Zinc finger)基序
由肽链的保守序列中的一对组氨酸加一对半胱氨酸(His2/Cys2)或 2对半胱氨酸(cys2/cys2)
与一个锌离子形成配位键,这些氨基酸对之间的多肤链成环状突出并折迭成指形结构,多个
指结构常串联重复。
锌指族转录因子以二聚体形式同 DNA上的顺式调控元件结合。
含锌指基序的转录因子:与 GC盒结合的 SPl、类固醇激素受体家族,抑癌蛋白WT1等。
③亮氨酸拉链(Leucine-Zipper)基序
由一段每隔 6个 a a
就有一个 Leu 的伸展肽链组成,这些周期性出现的 Leu 都位于α—螺旋的同—侧面,因此
两条均含 Leu拉链基序的蛋白质通过亮氨酸侧链的相互作用形成二聚体。
具有亮氨酸拉链基序的转录因子:原癌基因 C-Jun/C-fos(APl家族)
④螺旋-环-螺旋(Helix-loop-Helix,HLHt)基序.
由 2个α螺旋间隔一个非螺旋的环(loop)组成.
如原癌基因产物 C-myc及其结合蛋白Max.
含 HLH和 Leu-拉链基序的转录因子的相似性:
①均至少含有一个α螺旋,其中都有一侧亲水面和一侧疏水面,因此这两种基序又称为两亲
α—螺旋基序.
②两类转录因子均依靠α螺旋氨基端附近的碱性区(带正电荷 aa 区)与 DNA 结合,因此
又分别称为 bzip和 bHLH
(b=basic,碱性)
③两类转录因子活性都依赖于二聚体化
2、反式激活结构域(Transactivation domain) ‘
是反式作用因子的转录调控结构域,一般由 DNA结合结构域外的 30-100个 aa组成.
常见的反式激活域有以下几种:
①酸性α谨螺旋结构域(acidic a-Helix domain)如 Jun;
②富含谷氨酰胺结构域(glutamine—rich domain)如 SPl.
⑧富含脯氨酸的结构域(proline-rich domain)。
(二)反式作用因子家族
同一类序列特异性转录因子一般由基因家族编码,它们的蛋白结构同源,并结合特异的顺式
调控元件,这些蛋白组成一个反式作用因子家族。
1.POU家族
这一家族中都有一个独特的 DNA结合结构域-POIJ结构域.
POU结构域包括:
N端 POU特异结构域(POUs)+C端 POU同源异形结构域(POUH).
POU结构域是 Pit1,octl/oct2和 unc86等反式作用因子共有的保守区,因此这类蛋白统称
为 POU结构域蛋白。
2、类固醇激素受体家族
包括:糖皮质激素受体(GR),性激素受体(ER/AR),甲状素激素受体 (TR),维甲酸受体
(RAR),VitD3受体(VD3R).
这些受体位于胞质或核内,通过激活基因转录起作用.这些受体的 DNA结合结构域都含有
2 个 Cys2/Cys2 型锌指基序,(分别由 2 个外显子编码),可识别 DNA 上的激素应答元件
(HRE:Hormone
responsive elements)
3、NF-κB家族
包括 RelA(P65),P60,RelB,C-Rel,P50五种.主要是 P50/RelA异二聚体.
胞质中P50/RelA•Iκ B抑制蛋白(失活状态)→释放 Iκ B而被激活→易位至核内→
激活转录。
第三节 转录后加工
在细胞核内对基因产物(mRNA前体)进行各种修饰、剪接和编辑,使编码蛋白质的外显子部
分连接成为一个连续的开放读框(open
reading frame,ORF)的过程称为转录后加工.
一、mRNA前体加工的分子机制 -
核内 mRNA前体—异质性核 RNA(heterogeneous nuclear RNA,hnRNA),
hnRNA 与蛋白质结合形成核异质性核糖核蛋白(hnRNP), mRNA 前体的加工在 hnRNP 上进
行.
(一)5’-端加帽(capping)
—mRNA前体的 5’-端加甲基化鸟苷(m7pppN)
5’端 m7G帽子结构的作用:
1.使 mRNA更稳定
2.增加蛋白质合成的效率
3.帽子结构对 mRNA前体的剪接是必需的
(二)3’-端接多聚腺苷(poly(A))
—在 mRNA前体 3’端接上一个约 200—250个腺嘌呤核苷酸(A)的尾巴。
poly(A)尾巴的作用:
1.有利于 mRNA通过核孔;
2.参与稳定 mRNA;
3.增强翻译效率。
(三)mRNA前体的剪接
剪接(sp!icing)—剪除内含子,并将外显子连接
1.真核内含子的序列特征:
真核内含子总是由 Gu开始,以 AG结束,
内含子的 5’-端剪接点(供位)和 3’-端剪接点(受位),以及内含子中的一个内部序列分支点
(branchsite)是 mRNA前体正确剪接所必需的。
2.mRNA前体的剪接机制
-剪接过程由二步连续的转酯反应组成.该过程中产生一个套索状中间体( lariat
intermediate),结果使 2个原先被分隔的外显子连接。
3.剪接体(spliceosome)
细胞核内的小分子 RNA(一般≤300碱基)—SnRNA(small nuclear RNA),包括 U1—U6等。
snRNA 与特异的蛋白质形成复合物-SnRNP.mRNA 前体与 snRNP 形成的复合物—剪接
体.mRNA前体的剪接通过剪接体进行。
U2,U6,U4/U6 SnRNP等是活性剪接体的主要成份.
(四)RNA编辑(RNA editing)
是一种与 mRNA剪接不同的加工方式,指 mRNA在转录后因插入、缺失或核苷酸的替换,
改变了 DNA模板来源的遗传信息,从而翻译出氨基酸序列不同的多种蛋白质,
RNA编辑的例子:apo—B的编辑:C→U替换。
二、内含子的选择性剪接
选择性剪接(alternative
splicing):在 mRNA前体的剪接过程中,参加剪接的外显子可以不按其线性次序剪接,内含
子也可以不被切除而保留,即一个外显子或内含子是否出现在成熟 mRNA中是可以选择的,
这种剪接方式称为选择性剪接。此外,不同的启动子或不同的 poly(A)加尾位点的选择,也
可看作选择性剪接.
选择性剪接的主要方式。
由来自一个基因的 mRNA前体因选择性剪接而产生多种 mRNA,并翻译出的不同蛋白质,
称为同源异构体(isoform).
>5%的人基因可在不同的组织或生理状态下,通过选择性剪接产生不同的蛋白质异构体,这
是造成真接生物高度异质性的基础。
第四节 翻译水平调控
一、翻译起始因子(IF)的调节:可逆磷酸化的作用.
1.eIF-4F的磷酸化激活蛋白质的合成.
2.eIF-2的磷酸化引起翻译起始受阻,降低蛋白质的生物合成水平
二、mRNA结构与翻译控制 ,
(一)5’-UTR结构
1、mRNA5’端 m7G帽有增强翻译水平的作用.
2、“上游 AUG密码子”(位于起始 AUG上游的其他 AUG密码子)的存在往往抑制下游开放
读框的翻译效率.
3、起始 AUG旁侧序列对翻译效率的影响.Kozak序列:GCCAUGG
(二)3’-UTR结构
1.poly(A)尾增加翻译效率
2.富含 UA序列抑制翻译。
三、mRNA稳定性与翻译控制
mRNA稳定性主要取决于 3’—UTR结构
1.poly(A)尾增加 mRNA稳定性,
2.3’-UTR中 UA序列导致 mRNA不稳定.
四、翻译后修饰
1、 氨基酸侧链的共价修饰:乙酰化、磷酸化、糖基化(N-、O-);
2、 蛋白质前体的切割和成熟。Proprotein→protein.例:胰岛素的成熟。
五、蛋白质的分泌和胞内定位
信号肽:作为蛋白质定位信号的短肽序列,指导蛋白质运输到正确位置,定位结束后通常被
特异的信号肽酶切除。
常见几种信号肽的特点:
1内质网和细胞分泌信号:N-端约 20个左右氨基酸,疏水。
2 线粒体定位信号:N-端,一面为正电残基另一面为疏水残基的两亲α螺旋。
3 核定位信号:内部,常为碱性氨基酸加脯氨酸链两部分构成。
如 SV40 T 抗原:pro-lys-lys-lys-Arg-lys(127-132)
第四章 原癌基因与抑癌基因
第一节 概述
病毒致癌作用,病毒癌基因 Viral oncogene,V-onc).。
细咆癌基因(cellular oncogene ,c-onc)或原癌基因(protoncogene)
—正常细胞中与 v-onc同源的基因,
抑癌基因(tumor suppressor gene):是指由于其存在和表达而抑制细胞癌变的基因。
原癌基因与抑癌基因生物学性质差异:
1.功能:抑癌基因在细胞生长中起负调节作用,抑制增殖、促进分化成熟与衰老,或引导
多余细胞进入程序性细胞死亡(PCD),原癌基因的作用则相反.
2.遗传方式:原癌基因是显性的,激活后即参与促进细胞增殖和癌变过程,而抑癌基因为
隐性,只有发生纯合失活时才失去抑癌功能.
3.突变的细胞类型:抑癌基因突变不仅可发生在体细胞中,也可发生在生殖系(germ
1ine)细胞中,并通过其遗传突变,而原癌基因只在体细胞中产生突变。
第二节 原癌基因
原癌基因是细胞的正常基因,其表达产物对细胞的生理功能极其重要,只有当原癌基因发生
结构改变或过度表达时,才有可能导致细胞癌变。
一、原癌基因表达的特点:
l、正常细胞中原癌基因的表达水平一般较低,而且是受生长调节的,其表达主要有三个特
点:①具有分化阶段特异性;②细胞类型特异性;
③细胞周期特异性。
2、肿瘤细胞中原癌基因的表达有 2个比较普遍和突出的特点:
①一些原癌基因具有高水平的表达成过度表达•
②原癌基因的表达程度和次序发生紊乱,不再具有细胞周期特异性。
3、细胞分化与原癌基因表达 .
在分化过程中,与分化有关的原癌基因表达增加,而与细胞增殖有关的原癌基因表达受抑制。
二,原癌基因的结构改变与其表达激活
(一)点突变
C--ras:12、13、61位密码子点突变,存在于多种肿瘤.
C-ras编码蛋白(21kD,P21):RAS,是一种 GTP结合蛋白,具 GTP酶活性,是重要的信号转
导分子.
(二)染色体易位
染色体易位(translocation):是染色体的一部分因断裂脱离,并与其它染色体联结的重排过程。
因染色体易位造成的原癌基因激活:
1、 因易位使原癌基因与另一基因形成融合基因,产生一个具有致癌活性的融合蛋白,
如 t(9:22)使 c-abl与 bcr融合,产生一个致癌的 P210蛋白
2、因易位面使原癌基因表达失控,如 t(8:14)易位使 c-myc表达失控.
(三)基因扩增
基因扩增(gene amplification)即基因拷贝数增加.
如 HL-60和其它白血病细胞,C-myc扩增 8-22倍.其它:c-erb B,c-net.
(四)LTR插入
LTR是逆转录病毒基因组两端的长末端重复(long terminal repeat),其中含有强启动子序列。
三、原癌基因产物的功能
大多数原癌基因编码的蛋白质都是复杂的细胞信号转导网络中的成份,在信号转导途径中有
着重要的作用.
原癌基因产物可作为:
1、生长因子,如 sis(PDGF-β),fgf家族(int-2,csf-1等)
2、生长因子受体(质膜):具酪氨酸蛋白激酶活性,如 neu,ht,met,erbB,trk,fms,ros-1
等。
3、非受体酪氨酸蛋白激酶(质膜/胞质)
如 src家族:src,syn,fyn,abl,lck,ros,yes,fes,ret等.
4、丝氨酸/苏氨酸蛋白激酶(胞质):如 raf,raf-1,mos,pim-1,
5、G蛋白(质膜内侧),具 GTP结合作用和 GTP酶活性,如 ras家族中的 H-ras,K-ras,N-ras,
以及 mel和 ral等.
,
6.核内 DNA结合蛋白(转录因子)
如 myc家族,fos家族,Jun家族,ets家族,rel,erb A(类固醇激素受体)
第三节 抑癌基因
一、抑癌基因失活与杂合性丢失
抑癌基因为隐性癌基因,只有发生纯合失活时才对肿瘤形成起作用,通常的表现为抑癌基因
的一个等位基因丢失,面另一个存留的等位基因发生突变(点突变、微缺失,重排等),等位
基因丢失常伴有抑癌基因相邻区域的杂合性丢失(Loss
of heterozygosity,LOH),
LOS指肿瘤中特定染色体上某种 DNA多态性标志(如 RFLP,VNTR、STR或 SSCP等)的等
位基因片段在同一患者中由正常组织基因组中的两种变为一种,即等位基因型由杂合子变为
纯合子。
LOH是肿瘤细胞中部分染色体区域缺失的表现。
二、抑癌基因产物的功能
抑癌基因 p53
人 P53基因定位:17P13,11个外显子编码 393个氨基酸。
p53基因突变:存在于一半以上的人肿瘤中,多为点突变,主要发生于外显子 5-8,如肝癌中
的 249号密码子第 3碱基 G→T
,与黄曲霉素 B1有关。
P53蛋白结构和功能:
P53蛋白为核内转录因子,包括①核心区的 DNA结合域;②N端转录激活域;③C端介导
寡聚体化的结构域。
1、 P53的中央域识别和结合一个 10bp的启动子序列,可激活转录(通过 N-端的反式激活
域)。P53突变大多发生于中央 DNA结合域。
2、 P53也可结合 DNA损伤时产生的单链区域。
3、 P53是四聚体,寡聚化需要 C-端域
4、P53激活 cki p21, 后者抑制细胞周期于 G1期.
5、 p53 激活与负责辐身损伤的修复蛋白 GADD45,维持基因组稳定性。
6、P53诱导凋亡的机制尚不清楚。
7、正常情况下 p53以低水平存在,半衰期短。DNA损伤稳定 P53并增加其转录活性
8、Mdm2使 p53不稳定,易被降解,并能直接抑制其反式激活活性(Mdm2是癌基因)
第五章 信号转导
细胞外信号通过与细胞表面的受体相互作用转变为胞内信号并在细胞内传递的过程称为信
号转导(signal transduction)
跨膜信号转导过程包括:
1,胞外信号被质膜上的特异性受体蛋白识别,受体被活化;
2,通过胞内信号转导物(蛋白激酶,第二信使等) 的相互作用传递信号;
3,信号导致效应物蛋白的活化,引发细胞应答(如激活核内转录因子,调节基因表达)。
第一节 胞内信使
细胞内信使(intracellular messenger)是具有信息传递作用的一些小分子,也称为第二信使
(second
messengers)。
一、cAMP{环磷酸腺苷) ,
生成: 腺苷酸环化酶催化 ATP生成 cAMP;
代谢: cAMP磷酸二酯酶水解 cAMP产生 5’-AMP
功能: ,
①激活蛋白激酶 A
②抑制蛋白磷酸酯酶
二、cGMP(环磷酸鸟苷)
生成酶:鸟苷酸环化酶
代谢酶:cGMP磷酸二酯酶
功能:①激活蛋白激酶 G ②调控细胞膜离子通道
三、三磷酸肌醇(inositol triphosphate,IP3)和甘油二酯(diacyglycerol, DAG)
G-蛋白偶联受体激活磷脂酶 Cβ生成 IP3及 DAG
功能:
1、IP3:开放胞内钙库,激活 Ca2+途径.
2、DAD:在 Ca2+和磷脂酰丝氨酸存在下,激活蛋白激酶 C,
四、钙离子
细胞内钙离子主要贮存于胞内钙库(如肌细胞的肌浆网,SR)和线粒体中。
细胞质膜两铡[Ca2+]跨膜梯度:细胞外液>>胞浆
胞浆内[Ca2+]的调节一通过(质膜和钙库膜上的)钙离子通道(进入)和钙泵(出),
钙通道开放的条件:
①质膜或钙库膜去极化(可兴奋细胞);
成②IP3介导钙库膜上钙通道开放(任何细胞).
钙泵激活.线粒体钙泵的作用.
Ca2+功能:与钙调蛋白(calmodulin, CaM)结合形成 Ca2+•CaM复合物:
①激活腺苷酸环化酶和磷酸二酯酶,②激活 Ca2+•CaM依赖蛋白激酶
钙通道阻断剂及其临床应用。
五、一氧化氮(NO)
NO合成酶催化 L-精氨酸生成 NO和胍氨酸
NO合成酶(NOS)分类:①神经元型(nNOS).
②内皮细胞型(ecNOS)
③诱导型(iNOS)
功能:激活乌苷酸环化酶,刺激 cGMP合成。
NO的生理病理作用
第二节 蛋白激酶和蛋白磷酸酯酶
蛋白激酶(Protein
kinase,PK)催化蛋白质的含羟基氨基酸(丝/苏和酪)的侧链羟基形成磷酸酯(ATP的γ磷酸
基转移至氧).
蛋白质磷酸酯酶(Protein phosphatase,PPase)催化磷酸蛋白的磷酸酯键水解而去磷酸化。
细胞内任何一种蛋白质的磷酸化状态是由蛋白激酶和蛋白磷酸酯酶的两种相反酶活性之间
的平衡决定的。
蛋白质可逆磷酸化的调节在信号转导过程中有重要作用,是细胞生命活动的调控中心。
一、信号转导过程中的蛋白激酶
{一)丝氨酸/苏氨酸蛋白激酶(Ser/Thr PK)
是一大类特异地催化蛋白质的丝氨酸和苏氨酸残基磷酸化的激酶家族,参与多种信号转导过
程。
1、蛋白激酶 A(PKA)
-cAMP依赖性蛋白激酶.
PKA由两个催化亚基 C和两个调节亚基 R所构成
PKA参与 cAMP介导的转录水平调控。
PKA的其它(下游)底物:①多种代谢相关酶②核内组蛋白和非组蛋白③膜蛋白等。
2、蛋白激酶 C(PKC)
-Ca2+激活的/磷脂依赖性蛋白激酶.
调节:可被 Ca2+,DAG和磷脂酰丝氨酸激活.TPA(佛波酯)也可激活.
PKC分子由 N-端的调节区和 C—端催化区(亲水的蛋白激酶结构域)所组成。
PKC有多种亚型(>12种).
PKC可激活:
①受体,如 EGFR,胰岛素受体,细胞因子受体等。
②细胞骨架蛋白如Map,Tau.
②膜蛋白,如 Na+-H+交换蛋白,Ca2+-ATP酶等.
④核蛋白/转录因子,起始因子等,
⑤信号转导物如鸟苷酸环化酶,Raf-1等.
3、Ca2+•钙调蛋白依赖性蛋白激酶(Cam-PK)
Cam-PKII是一种多功能的蛋白激酶.
4。cGMP依赖的蛋白激酶(PKG)
功能:调节胞内钙离子.
5,DNA依赖的蛋白激酶(DNA-PK)
调节:结合游离 DNA片段后被激活,
底物:核内 DNA结合蛋白和转录因子,如 SPl,Fos/Jun,Myc和 P53,
作用:①参与 DNA修复和重组,
②通过激活 TF调节基因表达;
③参与细胞周期的关卡机制(Checkpoint).
6.丝裂原激活的蛋白激酶(Mitogen-activated protein kinase, MAPK)
调节:MAPK激酶-MAPKK(MEK)。
下游底物:核内转录因子如Myc,Jun,Ets及其它胞内蛋白.
(二)酪氨酸蛋白激酶(Tyrosine protein kinase,TPK)
—特异地催化蛋白质的酪氨酸残基磷酸化,
蛋白质酪氨酸磷酸化在细胞生长,分化和转化的调节中起重要作用。
1、经典的 src激酶家族
原癌基因 c-src 蛋白产物 Src 是一种酪氨酸蛋白激酶,它有三个基本结构域:从 C-端至 N--
端依次为 SH1、SH2,SH3(SH=src
homolog)。
SHl结构域:具酪氨酸激酶活性,
SH2结构域:能识别并结合含磷酸化酪氨酸的短序列,
SH结构域:通过脯氨酸和疏水性氨基酸残基与靶蛋白结合,
Src 家族:包括原癌基因 src,yes,lyn,fyn,lck,blk,fgr,bcd 和 yrk 编码蛋白,它们都
有 TPK活性.共同参与细胞转化的信号转导过程.
SH2 结构域在信号转导途径中的重要作用:由于含 SH2 结构域的信号转导分子可以识别和
结合其他含磷酸化酪氨酸的蛋白,因此,通过蛋白质的酪氨酸磷酸化/去磷酸化调节可以决
定信号转导分子的结合与解离,从而导致信号的开启或关闭。
2、JAK嫩酶家族
JAK(Janus kinase)激酶家族包括 Jakl,Jak2,Jak3,Tyk2等,
Jak激酶具有一个 TPK结构域和一个激酶样结构域,它们与 Src的 TPk激酶结构域具有同源
性,但 JaK激酶没有 SH2,SH3结构域;
Jak激酶主要参与细胞因子的信号转导.
二、蛋白磷酸酯酶对磷酸化的调节
(一)、丝氨酸/苏氨酸蛋白磷酸酯酶
这类酶选择性地作用于含磷酸丝氨酸或磷酸苏氨酸残基的肽链,使之脱去磷酸基团并改变生
物活性.
主要成员:PPl,PP2A,PP2B,PP2C,等.
PP2A,催化亚基及其功能.
(二)酪氨酸蛋白磷酸酯酶(PTPase)
蛋白质酪氨酸磷酸酯酶催化磷酸化酪氨酸残基的去磷酸化反应,与相应的酪氨酸蛋白激酶共
同调节蛋白质的磷酸化水平,
PTPase家族可分为 2类:
1、胞质型(非受体型):小的可溶性蛋白,只有一个催化结构域,
特点是合有 SH2 domain,如 PTPlC,,PTPlB等. ,
2.受体型(PTPR),是大的跨膜蛋白,特点是有 2个串联的胞浆催化结构域,如白细胞共同
抗原 CD45,