DNA复制是指原始
DNA分子解链并通过
碱基互补配对原则形成两个子DNA链的生物学过程,该过程发生在
细胞分裂周期的
S期。DNA复制以亲代DNA分子为模板,
脱氧核苷三磷酸为底物,还需相关酶和蛋白因子的参与,如:
DNA聚合酶、
DNA引物酶、
DNA连接酶、
核酸外切酶、
拓扑异构酶、
引发体等。
定义
DNA复制是指亲代DNA双链解链,分别作为模板按照
碱基互补配对原则指导合成新的互补链,从而形成两个子代DNA的过程,是细胞和多数DNA病毒增殖时发生的重要事件。因此,DNA的复制实际上是
基因组的复制,它是生命存在和演化的关键环节,保证了
基因信息的传递和
遗传的稳定性。
发现史
1865年孟德尔通过豌豆实验揭示遗传学的
基因分离定律和
基因自由组合定律。他提及的“
遗传因子”就是后来的“
基因”;
1928年,英国生物学家Frederick Griffith(1879年-1941年)通过
肺炎双球菌转化实验(小鼠体内转化)发现肺炎双球菌体内存在某种“转化因子”;
1944年,美国微生物学家Oswald Avery(1877年-1955年)和他的同事Colin MacLeod (1909–1972)、Maclyn McCarty (1911–2005)通过控制变量完成了肺炎双球菌的体外转化实验,发现
DNA是Griffith转化实验的关键,证实有活性的遗传物质是DNA;
但Avery实验结果遭到质疑,因为他的实验无法避免有少量杂质
蛋白质,加上当时人们依然倾向于结果复杂多样的蛋白质才是遗传物质,因此Avery的实验在当时并没有得到应有的承认;
1952年,Alfred Hershey(1908年-1997年)和Matha Chase(1927年-2003年)通过
同位素标记的
T2噬菌体增殖实验,再次证实DNA才是遗传物质,至此,DNA是遗传物质被人们彻底接受;
1953年4月25日,James Watson和Francis Crick在Nature发文提出DNA的
双螺旋结构,同时,富兰克林和威尔金斯(Franklin&Wilkins)通过对DNA进行
X射线衍射阐明了DNA的螺旋性质。他们提出在
DNA双螺旋模型中,碱基朝内,磷酸和糖在外部,A和T,C和G之间依靠
氢键结合,DNA以半保留的方式复制。这项成果在遗传学的史册上留下了划时代的一笔,使得Watson、Crick 以及Wilkins在1962年共同分享了诺贝尔生理学与医学奖;
1956年,Arthur Kornberg(1908年-2007年)用无细胞的
细菌抽提物证明了DNA的合成和自我复制,随后Kornberg进一步证明催化DNA前体元件的连接需要特定的
聚合酶,也证明了DNA是合成自身的直接
模板;
1958年,Matthew Meselson(1930年-)和Frank Stahl(1929年-)利用
氮同位素(15N/14N)
密度梯度离心实验,首次在分子水平上成功地证明了DNA的半保守复制;
1968年,冈崎令治(Reiji Okazaki)和冈崎恒子(Tsuneko Okazaki)利用同位素标记技术发现了长度为仅1,000-2,000个
核苷酸的DNA片段(后来称为
冈崎片段)并建立了
半不连续复制(semi-discontinuous replication)模型;
20世纪70年代-至今,复制酶系统的解析,发现
DNA聚合酶、
解旋酶、
拓扑异构酶等关键蛋白酶的功能。
过程
DNA复制包含
原核生物、
真核生物和
病毒。三者的DNA复制过程均包括引发、延伸、终止三个阶段。以下具体介绍。
原核生物DNA复制过程
引发
原核生物(如
大肠杆菌)以形成
引发体,催化
引物的生成为DNA复制起始的标志。复制起始部位的DNA超螺旋结构在
拓扑异构酶和
解旋酶的共同作用下被解松,随后
双螺旋打开形成单链模板,由
单链DNA结合蛋白(SSB)结合于已解开的单链上,形成
复制叉。在这一基础上,在
Dna A、
Dna B、
Dna C 等若干蛋白质因子的帮助下,
引物酶识别复制起点,组装形成引发体。然后以解开的单链 DNA 为模板,NTP为底物,引物酶按5'一3'方向催化合成一小段
RNA引物(十几个至几十个核苷酸不等),引物的3'-OH末端为
DNA聚合酶提供聚合延伸的起点。
E.coli的DNA复制起始区域的长度约245个碱基,由3组
串联重复序列(识别区)和两对方向相反的重复序列(AT富含区)组成。
延伸
在引发体形成及引物生成后,DNA链的延伸就开始了。DNA链的延伸过程是指底物
脱氧核糖核苷三磷酸(dNTP)的α-磷酸基团,在
DNA聚合酶的催化下,与引物的3'-OH端反应后,
脱氧核苷一磷酸(dNMP)的3'-OH端又成为链的末端,在与下一个底物分子反应再生成
3',5'-磷酸二酯键。子链合成的方向是沿 5'一3'方向进行。
前导链沿5'一3'方向进行连续延长,而
后随链沿5'一3'方向进行不连续延长。
复制延伸过程中,模板为DNA双链解开后的两条单链,按照
碱基配对的原则(即A=T和G=C)用来合成新的
互补链,得到两个子代的双链DNA分子。在同一个
复制叉上,两条链的延长在
DNA聚合酶III的催化下进行,
领头链进行连续延伸,而
随从链需要不断合成
RNA引物和
冈崎片段进行分段不连续合成。在DNA复制的过程中,领头链的合成先于随从链的合成。
终止
DNA复制的终止阶段包括切除
引物,填补引物水解所留下的空缺以及连接切口。这是由于
领头链是连续合成,但
随从链是不连续合成的。这一过程主要由
DNA聚合酶II发挥作用。当上一个
冈崎片段3'末端延伸至与下一个冈崎片段的5'末端相邻时,在
DNA连接酶催化下,前一片段上3'-OH与后一片段的5'-磷酸形成
磷酸二酯键,从而连接两片段间的缺口,得到连续的新链。
真核生物DNA复制过程
真核细胞DNA复制过程与原核生物基本相同,但真核生物DNA含量大,有
核小体、
端粒等特殊结构,因此,真核生物DNA复制更为复杂,其主要的复制过程如下:
起始
真核生物DNA复制的起始也主要包括了复制的起始点的识别、
双螺旋的解开、
引发体的形成及
引物合成,但其详细的分子机制仍未被完全阐明。
真核生物复制的起始分两步进行,即
自主复制DNA序列 (autonomously replicating sequence, ARS) 的选择和复制起始点的激活。首先,在
G1期,由复制
起始点识别复合体(ORC)的6个蛋白质,识别并结合ARS,只在
G期合成的不稳定蛋白Cdc6(细胞分裂周期蛋白6)和ORC结合,并允许MCM(小染色体维系蛋白)2~7蛋白在DNA周围形成环状复合体,此时,由ORC、Cdc6和MCM蛋白组装形成前复制复合物(
pre-RC)。但复制不能在G1期启动,因为pre-RC只能在
S期细胞周期蛋白依赖性激酶(CDK)
磷酸化激活后才起始复制。复制起始时,Cdc6和MCM蛋白被替代,Cdc6 蛋白的快速降解可阻止复制的重新起始。
延伸
真核生物在
复制叉和
引物生成后,DNA Pol δ在
增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)蛋白的协同作用下,在
RNA引物的 3-OH上连续合成
前导链。后随链的
冈崎片段也由DNA Pol δ酶催化合成。已经证明真核生物
冈崎片段的长度大致与
核小体的大小(135bp)或其倍数相当。当随链合成至核小体大小时,DNA Pol δ酶脱落,而由DNA Pol α再引发下一个
引物的合成。当引物合成后,DNA Pol δ继续催化新的冈崎片段合成。与
原核生物不同的是,真核生物DNA复制时的引物既可以是RNA也可以是DNA。
终止
事实上,大多数真核生物染色体在正常生理状况下复制,是可以保持其应有长度的,这是因为
染色体的末端有一特殊结构可维持染色体的稳定性,这种真核生物染色体线性DNA分子末端的特殊结构称为
端粒。形态学上,染色体末端膨大成粒状,DNA和它的结合蛋白紧密结合时,形成像两顶帽子盖在
染色体两端,故有时又称之为“端粒帽”。端粒可防止染色体间
末端连接,并可补偿DNA 5'末端去除
RNA引物后造成的空缺,可见端粒对维持染色体的稳定性及DNA复制的完整性起到重要的作用。端粒由
DNA和
蛋白质组成,
DNA测序发现端粒的共同结构是富含T、G的
重复序列。例如,人的端粒DNA含有TTAGGG 重复序列。端粒重复序列的重复次数由几十到数千不等,并能反折成
二级结构。
病毒DNA复制过程
单链DNA病毒DNA的复制
单链DNA病毒根据DNA信息可以分成两类:有意义DNA [(+)DNA]和
反义DNA [(-)DNA]。有意义DNA是指它的序列与
mRNA相同,不可以做
转录的模板。有意义DNA必须复制反义DNA链,才能作为转录的模板。而反义DNA的序列与RNA相反,可以直接被转录合成RNA。
细小病毒在宿主细胞内进行反义链的合成和DNA复制。病毒借助宿主细胞的
RNA聚合酶和
DNA聚合酶的帮助,同时发生转录和复制过程。
细小病毒有意义DNA基因组的两端都有115~300 nt的序列,自我折叠,部分有互补,形成
发夹结构。3端的发夹结构可以作为DNA复制的引物,合成互补链。通过
DNA连接酶填补缺口,形成双链的
环状DNA。发夹结构被特异性
限制性内切酶除去,再经过一系复杂的链分离和复制,恢复失去的部分片段,得到线性双链分子。
双链DNA病毒DNA的复制
双链DNA病毒分为双链环状DNA或
线状DNA,前者如乙肝病毒,后者如病毒一般可以分两类:在宿主细胞核内复制DNA者和完全在细胞质中复制DNA者。
即使在
宿主细胞核内复制DNA,情况还是有很大差异的。
腺病毒双链DNA有专门的
DNA聚合酶。乙肝病毒复制DNA时,要经历
逆转录的DNA聚合酶。
乳头瘤病编码一个蛋白质,它能启动宿主
DNA聚合酶对
病毒基因组进行复制。
疱疹病毒的线性双链DNA能在复制过程中环化。
单纯疱疹病毒有3个Ori,
巨细胞病毒也可能有1个以上的Ori,并通过滚动环机制进行复制。线性DNA的末端形成的
发夹结构是DNA复制所必需的。
这些
病毒的
基因组通常在DNA复制之前,会有一部分基因率先进行
转录,产生专门的
蛋白质或者
DNA聚合酶。这种先于DNA复制进行的转录被称为早期转录,它为DNA的复制准备了条件。也有些基因是在DNA复制之后完成转录的,这类转录被称为晚期转录。晚期转录是
病毒合成结构蛋白和子代病毒的装配的过程中必不可少的。
特点
无论是
原核生物还是
真核生物,其DNA复制都遵循以下复制特点:
半保留复制
DNA在复制时,以
亲代DNA的每一个单链作模板,合成两个双链
子代DNA,每个子代DNA中都含有一个
亲代DNA链,这种现象称为DNA的半保留复制。美国物理学家沃森(Watson)和英国生物学家克里克(Criek)提出了
双螺旋模型,使 DNA复制假说水到渠成。1958年,科学家用
同位素标记法和氯化铯密度梯度离心法证明了DNA半保留复制的假说。
双向复制
DNA复制时,在起始点处局部双链解开成两股,各自作为模板,子链沿
模板延长。解开的两股单链和未解开的
双螺旋形成的“Y”字形结构,称为
复制叉(replieationfork)。DNA合成时总是从复制起始点开始,形成两个复制叉,随后相背而行,这种复制方式称为双向复制。
半不连续复制
因为
DNA双螺旋的两股单链走向相反,一链为5'→3'方向,其互补链是3→5方向。此外,
DNA聚合酶合成方向为5'→3。因此,其中一股链合成方向与解链方向一致,复制是连续进行的,称为
前导链。另一股链的合成方向与解链方向相反,因此不能顺着解链方向连续延长,所以复制速度会慢于
领头链,被称为
后随链。后随链在复制过程中产生的不连续片段被称为
冈崎片段。
相关的酶和蛋白
参与 DNA 复制的有底物(dATP、dGTP、dCTP 和 dTTP)模板、
引物、
聚合酶及其他酶蛋白质因子。在大肠杆菌中复制不仅需要
DNA聚合酶,还需要20种或更多不同的酶和蛋白质,称为DNA复制酶系统,每种酶和蛋白质都执行特定的任务,DNA复制酶系统的复杂性反映了DNA结构和准确性的要求。DNA复制需要有关的酶和蛋白具体介绍如下:
解旋酶
要获得作为模板的DNA链,需要分离双链。这通过
解旋酶来完成,解旋酶是利用
ATP的化学能在
复制叉处分离两条DNA亲本链的酶。
拓扑异构酶
通过切割DNA的一条链或双链,释放DNA复制和转录过程中产生的张力,去除
复制叉前端产生的
正超螺旋,再将切割形成的断端连接成完整的DNA链,保证反应顺利进行。
单链DNA结合蛋白
分离的链由
单链DNA结合蛋白稳定。单链DNA结合蛋白结合于
解旋酶沿复制叉方向向前推进产生的单链区,以防止新形成的
单链DNA重新配对形成
双链DNA或被
核酸酶降解。
引物酶
在 DNA 聚合酶开始合成DNA之前,
引物必须已经存在于
模板上,通常由引物酶合成一小段RNA片段。
DNA连接酶
在移除
RNA引物并用DNA填充缺口后,DNA中仍有一个缺口
DNA连接酶催化两个双链DNA片段相邻的S'磷酸基与3' 羟基形成磷酸酯键,封闭缺口。
DNA聚合酶
1955年发现了大肠杆菌DNA聚合酶,后来又陆续发现了主要参与DNA修复的
DNA聚合酶Ⅱ和在DNA复制中起主要作用的
DNA聚合酶Ⅲ。20世纪90年代发现了罕见的在DNA修复中起作用的DNA聚合酶Ⅳ和V。
大肠杆菌DNA聚合酶的比较如表1所示。
意义
遗传稳定性
遗传物质的遗传稳定性是生物体能够保证
基因信息传递和维持物种稳定的重要保障。DNA的复制精确性、
细胞分裂过程中的错误修复和
染色体结构的稳定性等因素共同发挥作用,确保了遗传物质的传递和稳定。每个细胞分裂时,DNA都会复制,使得每个新细胞都能够拥有与母细胞相同的基因信息。这种遗传稳定性是生物体繁衍和进化的基础。
首先,DNA的复制精确性是保证遗传物质遗传稳定性的关键因素之一。DNA的复制是生物体进行细胞分裂和生殖的基础过程。在DNA复制的过程中,DNA双链解旋并拆开,形成两个互补的单链模板,然后通过
DNA聚合酶将新的
核苷酸加到模板上。DNA复制的精确性依赖于DNA聚合酶的高度选择性和担保机制。DNA聚合酶能够将正确的核苷酸配对到模板上,从而确保新的DNA链与原有的DNA链互补。此外,DNA复制还受到一系列酶的协同作用,包括DNA附属酶、化酶和纠错酶等。这些酶能够检测并修复复制过程中产生的错误,从而保证DNA复制的精确性和遗传稳定性。
其次,在细胞分裂过程中,错误修复机制也是维持遗传物质遗传稳定性的重要环节。细胞在分裂过程中需要复制和分离遗传物质,以确保每个新生细胞都持有完整的
基因组。然而,在这个复杂的过程中,细胞也存在着一定的风险,例如
DNA损伤、
交叉互换和错误的
染色体分离等。为了解决这些问题,细胞发展出了一系列错误修复机制。例如,细胞通过
细胞周期检查点来监测和纠正DNA损伤,阻止不稳定的细胞进入下一个分裂阶段。此外,细胞还具有
错配修复、
异源染色体重组和染色体修复等机制,用于纠正DNA分离和重组过程中发生的错误,从而保证细胞分裂过程中的遗传稳定性。
最后,染色体的
结构稳定性也是维持遗传物质遗传稳定性的重要因素。染色体是一种由DNA和蛋白质组成的复杂结构,它负责存储和传递基因信息。在细胞分裂和生殖过程中,染色体需要解开、拆分、复制和重新组装。这个过程中,染色体的结构稳定性至关重要。染色体的结构稳定性受到许多因素的影响,包括染色体的
DNA序列、
核小体的保存和调控机制。细胞通过一系列的保护机制,如
非同源末端连接修复、震荡响应和染色体
检查站等,来保持染色体的结构稳定性,避免染色体断裂、粘连和损失等事件的发生。
突变和进化
DNA突变是进化过程中的关键因素之一。它代表了基因组的多样性增加和新物种的形成。DNA突变是指DNA序列的错配、插入或缺失,通常是由于复制错误、环境因素或
遗传性疾病引起的。这些突变可以改变基因的功能、结构和表达,从而推动物种的进化。在进化的过程中,DNA突变不仅仅是产生新的基因型和表型的途径,还对性别的分化和性状的多样性产生重要影响。
性选择可能会增加某些突变在物种中的频率,进而导致物种分化和形成。例如,雄性物种在求偶过程中体现出的性选择压力可能导致一些突变在雄性个体中更频繁地出现,从而增加雌性对这些特征的偏好,进而加速了物种分化和进化。DNA突变对进化的影响不仅体现在单个个体,同时也在群体和物种水平上发挥着重要作用。在群体中,突变的积累可以增加
物种灭绝的风险,尤其是当
遗传多样性减少时。然而,突变的积累也可以为群体提供适应环境变化的潜力。在物种水平上,DNA突变为物种的起源、分化和适应性进化提供了基础。总之,DNA突变是进化过程中重要的推动因素之一。它通过增加基因组的多样性和改变基因的功能、结构和表达,推动物种的进化过程。
DNA突变引起的遗传病与分子诊断
需要说明的是,
DNA突变不仅会推动物种的进化,还会出现负面影响,如导致
人类遗传病的出现。该类疾病会影响后代的身体和智力发育,并造成功能损害。因此,对于遗传病的预防,需要做好婚前、
产前检查,
怀孕后对胎儿的生长发育情况进行及时的监测,对于查出有严重遗传病的胎儿,必要时需终止妊娠。目前,人类遗传病主要分为四大类:
单基因遗传病、
多基因遗传病、
染色体异常遗传病和
线粒体遗传病。
疾病类型
单基因遗传病:单基因遗传病是由一个基因突变引起的遗传病。单基因遗传病可分为
显性遗传病和
隐性遗传病。显性遗传病是指由
显性基因突变引起的遗传病,其特点是患者只要有一个突变基因即可发病。隐性遗传病是指由
隐性基因突变引起的遗传病,其特点是患者必须有两个突变基因才能发病。常见的单基因遗传病有
多指(趾)、
白化病、
先天聋哑、小头白痴、
血友病、
色盲等。
多基因遗传病:由多对基因控制的遗传病。这些基因单独对遗传性状作用小,称为
微效基因,几种微效基因累加起来,就产生明显的表型效应。多基因遗传病受遗传因素和
环境因素的双重影响,具有家族聚集现象,但没有单基因病遗传中所见到的系谱特点。多基因病在群体中的发病率高达15%~20%,包括:
原发性高血压、
冠心病、
无脑儿、
先天性心脏病和
精神分裂症等。
染色体异常遗传病:染色体异常遗传病是由染色体数目或结构异常引起的遗传病。染色体异常遗传病可分为染色体数目异常遗传病和染色体结构异常遗传病。染色体数目异常遗传病是指染色体的数目发生改变,如多一条染色体或少一条染色体。染色体结构异常遗传病是指染色体的结构发生改变,如
染色体缺失、
染色体倒位、
染色体易位等。常见的疾病包括:
唐氏综合征、
猫叫综合征、
先天性卵巢发育不全综合征、
先天性睾丸发育不全综合征等。
线粒体遗传病:线粒体遗传病是由线粒体基因突变或线粒体数量异常引起的遗传病。线粒体是细胞的能量工厂,线粒体基因突变或线粒体数量异常会导致线粒体功能障碍,进而引发线粒体遗传病。线粒体遗传病的临床表现多样,可以累及多个器官和系统。现已发现100多种疾病与线粒体基因突变或结构异常有关,如
糖尿病、
帕金森病等。
诊断技术
由于遗传性疾病病种繁多,临床表现复杂多样,且多为罕见病,临床上极易发生漏诊、误诊。目前除了少数遗传病通过干预可获得良好的预后,绝大多数遗传病仍缺乏有效治疗手段,因此遗传病的预防、诊断和治疗是一大亟待解决的医学问题。
分子诊断技术的应用和发展极大地改变了疾病的诊疗模式,使遗传病的诊断与防治困境得以改善。常见的分子诊断技术技术可分为2大类:经典的分子诊断技术(如
PCR、
荧光原位杂交、染色体微阵列分析和一代测序)和分子诊断新技术(如
数字PCR、二代测序、第三代测序、多重连接探针扩增技术、
微流控芯片、单分子光学图谱技术、RNA测序和核酸质谱)。
这些技术的推广应用和规范管理有力地推动了遗传病的诊断、机制研究和治疗探索。由于遗传病的治疗方案相对有限,多为对症治疗,对发病机制了解得越透彻全面,越有利于治疗药物的研发。而分子诊断技术的灵活应用可以在遗传病发病机制和治疗方法研究中发挥重要作用,尤其是多组学研究有助于进一步认识基因突变对机体、组织、细胞的分子水平的影响。并且随着
生物信息学的发展,大数据分析技术不断优化和进步,愈来愈多的有效信息将被挖掘和利用。