首页 百科知识 表观遗传学概述

表观遗传学概述

时间:2022-10-19 百科知识 版权反馈
【摘要】:1975年,Holliday对表观遗传学进行了较为准确的描述。当前表观遗传学的研究内容包括DNA甲基化表观遗传学、染色质表观遗传学、表观遗传基因表达调控、表观遗传学变异、表观遗传基因沉默、DNA甲基化在发育及进化中的作用等。表观遗传学是研究表观遗传变异的遗传学分支学科。表观遗传变异是指在基因的DNA序列没有发生改变的情况下,基因功能发生了可遗传的遗传信息变化,并最终导致了表型的变化。
表观遗传学概述_分子生物学技术

第一节 表观遗传学概述

1975年,Holliday对表观遗传学进行了较为准确的描述。他认为表观遗传学不仅在发育过程,而且应该在成体阶段研究可遗传的基因表达改变,这些信息能经有丝分裂和减数分裂在细胞和个体世代间传递,而不借助于DNA序列的改变,也就是说表观遗传是非DNA序列差异的核遗传。在其后的研究中,人们发现它不仅对基因表达、调控、遗传有重要作用,而且在肿瘤、免疫等许多疾病的发生和防治中也具有十分深远的意义。

当前表观遗传学的研究内容包括DNA甲基化表观遗传学、染色质表观遗传学、表观遗传基因表达调控、表观遗传学变异、表观遗传基因沉默、DNA甲基化在发育及进化中的作用等。

一、表观遗传学定义

DNA双螺旋结构的发现促进了分子遗传学的迅猛发展。经典中心法则认为:基因是具有特定遗传效应的DNA片段。遗传信息的流动是由DNA转录给RNA,再由RNA进入细胞质传递、表达为蛋白质,即“基因决定论”。而随着研究的深入,人们发现了一些与中心法则相悖的遗传现象,例如同窝出生的纯种小鼠毛色不同;同卵双生的两人具有完全相同的基因组,在同样的环境长大后,他们在气质、体质等方面有较大的差异。这些差异都不涉及基因碱基序列的改变,因而无法用经典的遗传学理论来解释。近年来,表观遗传学研究方法的建立和完善提供了解答这类问题的新思路。

表观遗传学是研究表观遗传变异的遗传学分支学科。表观遗传变异是指在基因的DNA序列没有发生改变的情况下,基因功能发生了可遗传的遗传信息变化,并最终导致了表型的变化。它是不符合孟德尔遗传规律的核内遗传。由此可以认为,基因组含有两类遗传信息,一类是传统意义上DNA序列所提供的遗传信息,用以编码生命必需的蛋白质;另一类是表观遗传学信息,记载着基因组修饰的信息,它提供了何时、何地、以何种方式去应用遗传信息的指令。

基因的表达受到细胞核内、外多层次的精确调控,是遗传调控和表观遗传调控的综合作用的结果。基因表达不只取决于DNA,DNA不能解释为什么有些基因会表达或关闭。研究在没有DNA序列改变情况下发生的可遗传的基因功能变化是表观遗传学的主要任务。广义上,DNA甲基化、基因沉默、基因组印记、染色质重塑、RNA干扰、X染色体失活、组蛋白乙酰化等都属于表观遗传的研究内容。

二、染色质结构与基因表达

1.染色质的基本结构 染色质的基本结构单位是核小体。在核小体中,DNA双链环绕在4对核心组蛋白H2A、H2B、H3和H4所组成的八聚体核心外1.75圈,并含有连接区的一个分子的H1组蛋白(图10-1)。

核心组蛋白是富含碱性氨基酸的小分子,在进化上比较保守,主要由N端尾端和保守的组蛋白结构域组成,有102~135个氨基酸残基。C端结构域只存在于H2A、H2B分子中。15~30个氨基酸残基组成的N端是突出在核小体核心外、带电荷的尾端,是组蛋白翻译后修饰的主要结构域,具有稳定DNA环绕组蛋白核心八聚体的作用。H3/H4的N端含有多个可以受乙酰化调节的赖氨酸残基,以及受甲基化调节的赖氨酸和精氨酸残基;丝氨酸残基的磷酸化也在调节组蛋白修饰进程中起作用。

图10-1 染色质的基本结构单位-核小体

H1组蛋白是哺乳动物核小体连接区的结合蛋白。H1组蛋白较大,约有220个氨基酸残基,与核小体的稳定和高级结构装配有关。

2.染色质的高级结构 通过核小体,DNA长度压缩了7倍,形成直径为11nm的纤维,见图10-2(1)。这种“串珠状”的核小体结构常见于活性染色质中,即常染色质。但通常在光学显微镜下观察到的是直径30nm的纤维,见图10-2(2),它是由6个核小体压缩形成螺线管样结构。30nm纤维的形成与核小体之间蛋白质的相互作用有关,连接组蛋白H1和核心组蛋白N端尾端均参与这种相互作用,去除组蛋白H1的染色质中,30nm纤维解体为更细的纤维。

图10-2(1) 染色质“串珠状”结构

图10-2(2) 30nm染色质纤维

30nm的纤维可以折叠成为一系列的环状结构结合在核基质上,每个环高度约为300nm。这一过程需要拓扑异构酶Ⅱ和染色体结构维持蛋白的参与,并压缩到了1000~10000倍。环状结构的染色质进而盘绕成直径为700nm的染色单体。经过这一系列的装配,人类基因组可通过约2000个大环最终浓缩30万倍而装配在染色体中(图10-3)。

3.染色质的结构对基因表达的影响 常染色质中的基因可以转录,异染色质中未见有基因转录,且原本在常染色质中表达的基因如果移到异染色质内也会停止表达。哺乳类雌体细胞二条X染色体,到间期一条变成异染色质,这条X染色体上的基因就全部失活,可见紧密的染色质结构能阻止基因的表达。

早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转录,去除组蛋白,基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与DNA链上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了非特异性阻遏蛋白的作用。染色质中的非组蛋白成分具有组织细胞特异性,可能消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。

发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色质区段,有富含赖氨酸的组蛋白(H1组蛋白)水平降低,H2A·H2B组蛋白二聚体不稳定性增加、组蛋白乙酰化和泛素化,以及H3组蛋白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。转录活跃的区域也常缺乏核小体的结构,这些都表明核小体结构影响基因转录。

图10-3 染色体的包装

真核DNA中的胞嘧啶约有5%被甲基化为5-甲基胞嘧啶(5-methylcytidine,m5C),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低。这种甲基化最常发生在某些基因5′侧区的CpG序列中,实验表明这段序列甲基化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合从而影响转录。如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎就不能正常发育而死亡,可见DNA的甲基化对基因表达调控的重要性。由此可见,染色质中的基因转录前先要有一个被激活的过程,但目前对激活机制还缺乏认识。

三、DNA甲基化和去甲基化

DNA甲基化是常见的表观遗传现象,它是由DNA甲基转移酶(DNA methyl-transferase,DNMTs)催化S-腺苷甲硫氨酸作为甲基供体,将胞嘧啶转变为m5C。在真核生物DNA中,m5C是唯一存在的化学性修饰碱基。

在哺乳类,DNA甲基化是必不可少的,它广泛分布在转座元件、其他重复的DNA和大多数功能基因的编码区,而且几乎所有的甲基化胞嘧啶都发生在CpG二核苷酸(CpGs)。在结构基因的5′端调控区段,CpG二联核苷常常以成簇串联的形式排列,这种富含CpG二联核苷的区域称为CpG岛。CpG岛主要位于基因的启动子和第一外显子区域,约有60%以上基因的启动子含有CpG岛。通过基因启动子区及附近区域CpG岛胞嘧啶的甲基化可以在转录水平调节基因的表达,从而引起相应的基因沉默,去甲基化又可恢复其表达。DNA甲基化在生理情况下就参与了控制基因的时空表达,在肿瘤发生时,肿瘤细胞全基因组低甲基化是一个重要特征。肿瘤细胞基因组甲基化的程度与正常细胞相比仅为20%~60%,同时伴有抑癌基因CpG岛中的CpG位点呈高度甲基化状态,以至于染色体螺旋程度增加及抑癌基因表达的丢失。

一般说来,DNA的甲基化会抑制基因的表达。DNA的甲基化对维持染色体的结构、X染色体的失活、基因印记和肿瘤的发生发展都起重要的作用。

由于CpG岛甲基化导致抑癌基因转录失活是一个可以逆转的表观遗传学基因修饰过程,且该逆转(CpG岛去甲基化)可直接恢复抑癌基因功能,故DNA去甲基化恢复抑癌基因功能的研究成为肿瘤基因治疗的新型手段之一。DNA甲基转移酶催化DNA甲基化,在肿瘤细胞中常表现为过度表达。因此,DNMT成为目前DNA去甲基化恢复抑制癌基因功能的热点靶分子。人类DNMT家族有:DNMT1在细胞分裂过程中维持DNA新生链的甲基化状态与方式;DNMT3A和DNMT3B催化DNA甲基化新生位点;DNMT2缺乏前三者的N末端催化活性结构域,因而无DNA甲基化催化活性。由于DNMT1对于维持DNA甲基化状态与方式在亲代和子代DNA链之间的高保真复制十分重要,所以特异性地抑制DNMT1活性,可使CpG岛甲基化转录失活的抑癌基因恢复功能。

目前应用于去甲基化的药物主要有5′-氮胞苷(5′-aza-cytidine,5-aza-C)或5′-氮-2′-脱氧胞苷(5-aza-2′-deoxycytidine,5-aza-CdR)。对于其作用机制较为认同的观点是:5-aza-C和5-aza-CdR进入细胞后被磷酸化成为三磷酸胞苷的形式,主要嵌入DNA、RNA的核酸序列中,与DNA甲基转移酶形成共价结合,使DNMTs无法发挥其催化甲基转移的功能,从而达到去甲基化的作用。5-aza-CdR运用在乳腺癌、肺癌、膀胱癌等体外培养的肿瘤细胞株中,逆转了Rb、VHL、p15、p16、E-cadherin和APC等多个抑癌基因启动子的甲基化状态,使不同的抑癌基因得以开放,进而有效地抑制了肿瘤的发展。5-aza-CdR在临床上已应用于白血病的治疗,而且已经取得了一定的疗效。当然和其他抗肿瘤药物一样,5-aza-CdR也有其常见的不良反应,如骨髓抑制和白细胞减少等。

由此可见,关于表观遗传调控的研究有助于更加深入地了解DNA与蛋白质的相互联系和相互作用。DNA甲基化是当前研究的热点,它与稳定表观遗传学状态、染色质结构和异染色质关系不断被揭示。尤其是在肿瘤成为人类健康生活的最大威胁的情况下,对于它的研究显得格外重要。去甲基化治疗原理比较复杂,彻底阐明有待于进一步研究。

图10-4 核心组蛋白修饰与特定的染色质级结构

四、核心组蛋白修饰

组蛋白是染色体基本结构-核小体中的重要组成部分,其N端氨基酸残基可发生乙酰化、甲基化、磷酸化、泛素化、多聚ADP糖基化及SUMO化等多种共价修饰作用(图10-4)。单一核小体上的修饰组合可达上千种,且这些修饰大多是可逆的。特定的染色质高级结构如常染色质和异染色质区域很大程度上取决于核小体组蛋白尾部不同修饰的不同组合。组蛋白的修饰可通过影响组蛋白与DNA双链的亲和性,从而改变染色质的疏松或凝集状态,或通过影响其他转录因子与结构基因启动子的亲和性来发挥基因调控作用。组蛋白修饰对基因表达的调控有类似DNA遗传密码的调控作用。因此,我们把组蛋白中被修饰氨基酸的种类、位置和修饰类型称为组蛋白密码,它决定了基因表达调控的状态。

1.组蛋白的乙酰化 是由组蛋白乙酰基转移酶(HATs)和组蛋白去乙酰化酶(HDACs)协调进行的,主要发生在组蛋白N-末端的赖氨酸。组蛋白乙酰化呈多样性,核小体上有多个位点可提供乙酰化,但特定基因部位的组蛋白乙酰化和去乙酰化以一种非随机的、位置特异的方式进行。例如,IFN-β基因启动子附近组蛋白赖氨酸(H4K8、H3K9和K14)乙酰化,该表面能与特异的蛋白识别模块结合。H4K8修饰产生的特异信号是SWI/SNF复合物BRG1组分的识别结合面,而H3K9和K14修饰产生的信号是TFⅡD组分TAFⅡ250的识别结合面。因此,这些特异的蛋白识别面代表了IFN-β启动子组蛋白乙酰化“密码”,并参与IFN-β转录激活作用的调节。

组蛋白的乙酰化与染色质构象有直接的联系。体外研究发现,在类似生理条件的离子强度和缺乏H1时,将乙酰化的组蛋白八聚体与海胆的5SrRNA基因的线状DNA结合后,乙酰化的核小体复合物呈伸展状态,而未乙酰化的对照组核小体的构象呈紧缩状态。进一步研究表明,组蛋白乙酰化后产生了两个变化:①DNA的构型变得松散,转录因子得以和核小体包裹的顺式激活部位结合;②一些转录因子可招募能与之结合的反式激活因子如CREB结合蛋白(CBP),CBP不仅参与启动基因转录,还间接引起组蛋白乙酰化。CBP是cAMP应答元件结合蛋白的辅激活蛋白,通过乙酰化组蛋白,促使和cAMP应答元件作用的启动子开始转录。

去乙酰化可阻遏基因的活性。在酵母中SIN3和Rpd3的突变将阻遏基因转变,Rpd3具有HDACs活性。SIN3和Rpd3与DNA结合蛋白Ume6形成复合物,而此复合物阻遏由Ume6结合的URS1(上游阻遏序列)元件的启动子转录。阻遏复合体含有3个成分:DNA结合亚基、辅阻遏物和组蛋白的去乙酰化酶。

2.组蛋白的甲基化 是由组蛋白甲基转移酶(histone methyltransferases,HMTs)完成的,甲基化可发生在赖氨酸和精氨酸残基上,赖氨酸残基能够单、双、三甲基化,而精氨酸残基能够单、双甲基化,这就极大地增加了组蛋白修饰调节基因表达的复杂性。当前的证据表明,组蛋白精氨酸甲基化是一种相对动态的标记,精氨酸甲基化与基因激活相关,而H3和H4靶精氨酸的甲基化丢失与基因沉默相关。相反,赖氨酸甲基化似乎是基因表达调控较为稳定的标记。例如,H3第4位的赖氨酸残基甲基化与基因激活相关,而第9位和第27位赖氨酸甲基化与基因沉默相关。

在对植物和真菌的研究中发现,组蛋白甲基化和DNA甲基化两者具有功能上的内在联系。如H3K9的甲基化是DNA甲基化的必要条件,同样DNA的甲基化可以导致H3K9的甲基化。这样的相互作用模式在哺乳动物中同样存在,H3K9的甲基化直接导致了中心粒周围异染色质DNA的甲基化。HDACs、HMTs和甲基化结合蛋白的相互作用导致了DNA甲基化酶的重新聚集。但目前仍不清楚是什么原因导致了这种甲基化酶对特异性靶序列的不同的表观遗传修饰现象。

3.组蛋白的磷酸化 组蛋白的磷酸化修饰是另外一种重要的调控方式,它在基因转录、DNA修复、细胞凋亡及染色质凝集过程中起重要作用。在凋亡的级联反应中,激酶(包括CHK1和CHK2)的主要底物之一是组蛋白衍生物H2AX,H2AX的磷酸化是凋亡早期最早标志之一。在凋亡后期,caspase激活蛋白激酶Mst1,Mst1使组蛋白H2B的14位丝氨酸磷酸化。这一修饰在染色质浓缩步骤中可检测到,是凋亡途径良好的标记物。也有报道称在凋亡过程中发现组蛋白H2B的第32位丝氨酸磷酸化。

有丝分裂过程也与特异性组蛋白修饰有显著的相关性(表10-1)。在有丝分裂过程中,有数个组蛋白磷酸化反应,其中大多数由Aurora B激酶催化。特异性组蛋白修饰可在有丝分裂的不同阶段检测到,在细胞核分裂中发挥多种功能。

表10-1 各分裂期组蛋白磷酸化位点

和其他表观遗传修饰一样,磷酸化修饰也可能是通过两种机制影响染色体的结构和功能:①修饰改变了组蛋白的电荷,因而改变了组蛋白与DNA结合的特性;②修饰能够产生蛋白识别模块的结合表面,与特异的蛋白复合物相互作用。

4.组蛋白的泛素化 泛素(ubiquitin,Ub)是高度保守的、含76个氨基酸的蛋白质,相对分子质量为8500,在真核生物体内广泛存在。泛素化修饰是转录后的修饰方式之一。泛素化调节途径共有3种类型酶催化:泛素激活酶(ubiquitin-activating enzyme,El)、泛素接合酶(ubiquitin-conjugating enzyme,E2)、泛素-蛋白质连接酶(ubiquitin-protein ligase,E3)。组蛋白的泛素化修饰与经典的蛋白质的Ub调节途径不同,不会导致蛋白质的降解,但是能够招募核小体到染色体,参与X染色体的失活,影响组蛋白的甲基化和基因的转录。组蛋白的去泛素化修饰同样与染色质的结构及基因表达密切相关。

组蛋白H2A在1975年被首次发现有泛素化修饰,其泛素化修饰位点是高度保守的赖氨酸残基119(K119)位点。研究发现在大量高等真核生物中H2A总量的5%~15%被泛素化,除了在芽殖酵母中没有发现泛素化的组蛋白H2A(ubiquitinated-H2A,uH2A)以外,在许多组织和细胞中都发现有多聚泛素化的H2A。研究还发现,组蛋白H2A的泛素化能够促进组蛋白H1与核小体的结合,促进多聚梳群蛋白的沉默,还在X染色体失活的起始过程中有重要作用。

组蛋白H2B的泛素化修饰对基因的表达有调控作用。Henry等通过对GAL1基因表达的研究提出了一个组蛋白H2B泛素化调控基因转录的模型:GAL1基因的正常转录需要组蛋白H2B的泛素化和去泛素化修饰,并且泛素化过程非常短暂。首先组蛋白H2B发生泛素化修饰,H2B的泛素化修饰导致了H3的第4位赖氨酸的甲基化;紧接着H2B发生去泛素化,这又诱使H3的第36位赖氨酸甲基化,此时GAL1基因能够正常转录。如果组蛋白H2B未发生泛素化,则H3的第4位赖氨酸不会甲基化,此时H3的第36位赖氨酸高甲基化,从而基因低水平转录。如果组蛋白H2B仅发生了泛素化修饰,而随后没有去泛素化修饰,那么H3的第4位赖氨酸高甲基化、H3的第36位赖氨酸低甲基化,此时基因仍然只能低水平转录。由此可见,H2B去泛素化能够促进H3的第4位赖氨酸和H3的第36位赖氨酸之间的甲基化平衡,从而调控GAL1基因的正常转录。

相比较而言,组蛋白H3和H1的泛素化形式比H2A和H2B少,目前也还没有发现组蛋白H3和H1的泛素化位点。现将已知组蛋白泛素化的位点及其产生的生物学效应作一汇总(表10-2)。

表10-2 组蛋白的泛素化修饰

5.组蛋白密码 20世纪60年代,Stedman等发现组蛋白可以与DNA结合,降低DNA的转录活性,使组蛋白成为研究热点。核小体主要由4种组蛋白(H2A,H2B,H3和H4)构成。这4种组蛋白和缠绕于组蛋白的DNA共同组成了核小体。每个组蛋白都有进化上保守的N端拖尾伸出核小体外。这些拖尾是许多信号传导通路的靶位点,从而导致转录后修饰。该类修饰包括:乙酰化、甲基化、磷酸化、泛素化及ADP核糖基化等。它们可作为一种标志或语言,因此被称作“组蛋白密码”。组蛋白密码可被一系列特定的蛋白质所识别,将其翻译成一种特定的染色质状态以实现对特定基因的调节。

组蛋白乙酰化、甲基化修饰能为相关调控蛋白提供其在组蛋白上的附着位点,改变染色质结构和活性。一般来说,组蛋白乙酰化能选择性地使某些染色质区域的结构从紧密变得松散,开放某些基因的转录,增强其表达水平。而组蛋白甲基化既可抑制也可增强基因表达,乙酰化修饰和甲基化修饰往往是相互排斥的。在细胞有丝分裂和凋亡过程中,磷酸化修饰能调控蛋白质复合体向染色质集结。显然各种不同的组蛋白修饰是细胞对外在刺激作出的反应,几乎都会涉及染色质活性的改变。既然几乎每一种生物学过程都有特定的组蛋白修饰标记,那么特定的组蛋白修饰标记就能反应相应的特定生物学过程。因此,通过组蛋白修饰系列抗体特异性地识别靶蛋白修饰形式,就能简化对组蛋白修饰的研究。

五、染色质重塑

DNA复制、转录、修复、重组在染色质水平发生,这些过程中,染色质重塑可导致核小体位置和结构的变化,引起染色质变化。ATP依赖的染色质重塑因子可重新定位核小体,改变核小体结构,共价修饰组蛋白。重塑包括多种变化,一般指染色质特定区域对核酶稳定性的变化。人们发现体内染色质结构重塑存在于基因启动子中,转录因子(TF)以及染色质重塑因子与启动子上特定位点结合,引起特定核小体位置的改变(滑动),或核小体三维结构的改变,或两者兼有,它们都能改变染色质对核酶的敏感性。关于重塑因子调节基因表达机制的假设有两种:①一个转录因子独立地与核小体DNA结合(DNA可以是核小体或核小体之间的),然后这个转录因子再结合一个重塑因子,导致附近核小体结构发生稳定性的变化,又导致其他转录因子的结合,这是一个串联反应的过程;②由重塑因子首先独立地与核小体结合,不改变其结构,但使其松动并发生滑动,这将导致转录因子的结合,从而使新形成的无核小体的区域稳定。

在核小体重塑过程中,重塑因子复合物的作用非常重要。这些复合物都具有ATP酶活性。SWI-SNF复合物和ISWI复合物家族是最先从酵母和果蝇体内发现的两种。SWI-SNF中的组分BRG1、hBRM和ISW I相关复合物的组分Hsnf2L、Hsnf2h具有ATP酶活性。人的SWI-SNF复合物是一个有很多分子的聚合物,包含BRG1或hBMR和肿瘤抑制蛋白Hsnf5-V121,它主要激活基因转录,还与免疫球蛋白及TCR基因重组有关。ISWI复合物家族包括RSF、HuCHRAC、CAF等13个复合物。RSF是一个异二聚体,组分包括Hsnf-h,主要参与转录起始:HucHRAC含有Hsnf2h和染色质组装因子Hacf1,与异染色质的复制状态维持有关;CAF1参与染色质组装,改变染色质的状态,使其与DNA功能相关。实验证明:BRG1、Hbrm、Hsnf-h、Mi都显示了ATP酶的活性。此外,体外实验证明:SW2-SNF复合物和ISWI相关复合物的作用机制存在很大差别。ISWI相关复合物只识别核小体,而SWI-SNF复合物识别核小体和裸露的DNA,亲和力高,通过与DNA作用,可移动核小体,产生更易被影响的DNA区域,且SWI-SNF的作用不受组蛋白N端或C端修饰的影响。

染色质重组过程中,核小体滑动可能是一种重要机制,它不改变核小体结构,但改变核小体与DNA的结合位置。实验证明,这种滑动能被核小体上游的“十字形”结构阻断。但“滑动”机制并不能解释所有实验现象。人们推测,在重组过程中,还有其他机制如核小体可能与DNA分离,然后核小体经过重排,结构变化后与DNA重新组装,产生新的结构形式,整个过程是可逆的,受其他因子调节,某些因子可决定反应进行方向。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈