首页 理论教育 表观遗传概述

表观遗传概述

时间:2022-04-25 理论教育 版权反馈
【摘要】:表观遗传学已成为生物学的重要分支,推动遗传学快速发展,成为生命科学领域的研究前沿。综上所述,表观遗传修饰改变与许多疾病的发生密切相关。随着表观遗传学研究不断深入,大量疾病发病机制将逐渐阐明,表观遗传学将在疾病诊疗和新药研发中发挥越来越重要的作用。表观遗传学研究DNA序列改变之外的遗传信息,聚焦于基因表达的分子调控机制,对于研究功能基因组具有基础性作用。

一、表观遗传学及其与遗传学的关系

(一)表观遗传学的定义

表观遗传学是研究在DNA序列不发生改变的条件下,由于DNA甲基化(DNA methylation)和羟甲基化等、组蛋白甲基化和乙酰化等、染色质结构、非编码RNA等改变,使基因表达发生可遗传的变化,并最终导致表型变异的遗传学机制。DNA和组蛋白上的各种修饰又称为表观遗传修饰(epigenetic modification)。大量研究表明,表观遗传修饰与胚胎发育、细胞分化及疾病发生等密切相关。表观遗传学已成为生物学的重要分支,推动遗传学快速发展,成为生命科学领域的研究前沿。

DNA甲基化异常与许多疾病发生有关。DNA甲基化与基因印记(gene imprinting)有关。基因印记异常可导致Angelman综合征、Silver-Russell综合征、Prader-Willi综合征及Beckwith-Wiedemann综合征等多种综合征。基因印记还与糖尿病、精神分裂症、自闭症及肿瘤等有关。DNA甲基转移酶可催化DNA甲基化形成。DNA甲基转移酶突变可使基因组DNA甲基化异常,进而导致ICF综合征、白血病等。MeCP2基因编码甲基结合域(methyl-binding domain,MBD)蛋白,该基因突变与雷特综合征(Rett syndrome)相关。DNA甲基化水平升高可导致基因沉默。在肿瘤中,DNA甲基化异常可使基因表达谱发生异常改变,使癌基因表达升高,抑癌基因表达下降;DNA低甲基化还可使染色体不稳定,导致肿瘤发生发展。此外,组蛋白修饰异常也与疾病发生有关。组蛋白乙酰化、甲基化异常可严重扰乱基因表达,导致肿瘤、神经系统疾病发生。组蛋白修饰还可与DNA甲基化修饰协同作用,共同促进疾病发生发展。

非编码RNA主要包括微小RNA(microRNA,miRNA)和长链非编码RNA(long noncodingRNA,lncRNA)。miRNA通过与mRNA配对,可导致mRNA降解,抑制mRNA翻译等。miRNA异常可导致肿瘤、糖尿病、心血管疾病等发生发展。lncRNA可通过在蛋白编码基因上游启动子区发生转录,干扰下游基因的表达,或通过抑制RNA聚合酶Ⅱ,介导染色质重构及组蛋白修饰,影响下游基因表达,在肿瘤发生中发挥重要作用。

综上所述,表观遗传修饰改变与许多疾病的发生密切相关。随着表观遗传学研究不断深入,大量疾病发病机制将逐渐阐明,表观遗传学将在疾病诊疗和新药研发中发挥越来越重要的作用。

(二)表观遗传学与遗传学的区别和联系

经典遗传学是以基因序列突变或染色体变异为基础的,关注基因遗传和序列变异与表型变异的关系,但是表观遗传学并不关注基因序列变异,而主要聚集于DNA甲基化、组蛋白修饰、非编码RNA、基因表达调控及遗传表型的变化,两者的遗传基础和研究重点不同。

经典遗传提供了合成生命所需的模板序列,而表观遗传提供了对模板序列的精确调控,指导模板序列何时、何地、以何种方式进行转录和翻译。因此,表观遗传和经典遗传构成生命遗传的两个方面,两者既相互区别又相互依存,从而构成完整的生命遗传体系。

整个基因组表达通过DNA精确地复制、转录和翻译,保证遗传信息的稳定性和连续性;同时又通过表观遗传学机制,使基因组在内、外环境条件下选择性地表达信息,最终形成遗传性状。在整个生命过程中,表观遗传机制能对环境刺激,如激素、生长因子等做出适当反应,而不伴有DNA序列改变。表观遗传学把遗传和环境因素有机结合起来,使基因组不仅具有很强的稳定性,而且具有精确的反应性和强大的适应性。

二、表观遗传学的研究内容

在人类认识自身生命现象的过程中,人类基因组测序项目的完成是具有里程碑式重要意义的事件。然而比基因组测序项目更复杂、更有挑战性的是研究人类功能基因组。研究功能基因组将有助于人类理解基因表达调控的分子机制,为解释生命现象、阐明发病机制等提供坚实的理论基础。表观遗传学研究DNA序列改变之外的遗传信息,聚焦于基因表达的分子调控机制,对于研究功能基因组具有基础性作用。

真核细胞中,细胞核内的主要物质有DNA序列、蛋白及RNA等。蛋白质包括组蛋白和非组蛋白,RNA包括编码的和非编码的RNA。从广义上讲,除了研究DNA序列改变, DNA序列上的各种修饰、组蛋白共价修饰、非组蛋白修饰及非编码RNA(主要是miRNA和lncRNA)等均属于表观遗传学的研究内容。但是,从目前主要的研究情况来看,表观遗传学的研究内容主要有DNA甲基化、羟甲基化、组蛋白共价修饰和非编码RNA等。根据基因的转录前后,可将DNA甲基化、基因印记、组蛋白共价修饰和染色质重塑等归为基因选择性转录表达的调控;将非编码RNA归为基因转录后的调控。

(一)基因选择性转录表达的调控

真核生物的遗传信息主要存储于细胞核内,细胞核内的主要物质是染色质,染色质主要由DNA和蛋白质组成。DNA上的共价修饰主要是甲基基团修饰,形成DNA甲基化。此外,近年来还发现DNA上有羟甲基、甲酰基及羧基等修饰。蛋白质包括组蛋白和非组蛋白两类。

1.DNA甲基化 DNA甲基化是常见的表观遗传现象,是指在DNA甲基转移酶(DNMT)的作用下,将甲基基团添加到DNA分子的碱基上。常见的DNA甲基化发生在胞嘧啶(C)第5位碳原子和甲基间的共价结合,胞嘧啶由此成为5-甲基胞嘧啶(5-m C),5-m C在TET(TET1,TET2,TET3)羟基化酶作用下可转化为5-羟甲基胞嘧啶(5-hm C),5-hm C还可进一步转化为5-f C、5-ca C等(图15-1)。

图15-1 C→5-m C→5-hm C→5-f C→5-ca C转化

哺乳动物基因组DNA中5-m C占胞嘧啶总量的2%~7%,约70%的5-m C存在于CpG二核苷序列。在结构基因的5′端调控区域,CpG二联核苷常常以成簇串联的形式排列。这种富含CpG二联核苷的区域称为CpG岛(CpG island)。CpG岛具有以下特征:①CpG岛主要位于基因的启动子区及其上下游附近。②CpG岛一般是非甲基化的,看家基因的启动子大部分会有CpG岛,且保持非甲基化状态。通常组织特异表达的基因CpG含量较少,且处于甲基化状态,其表达活性受到调控,且在大多数组织中的表达被抑制。③启动子区CpG甲基化可导致基因表观遗传沉默。启动子区CpG岛甲基化可能会在空间上阻碍转录因子复合物和DNA结合。因此,启动子DNA甲基化与基因表达沉默相关,而非甲基化与基因活化相关。④启动子区CpG甲基化程度与转录水平相关。基因表达水平较低时,其转录可因启动子区甲基化增强而进一步抑制,当启动子被增强子、组蛋白修饰或其他转录因子激活时,其转录功能可恢复。因此,启动子区CpG甲基化与增强子、组蛋白修饰、转录因子协调作用,调控基因精确转录。

DNA甲基化分为维持性甲基化和构建性甲基化。维持性甲基化是指在甲基化的DNA模板指导下使新合成链被甲基化。当一个甲基化的DNA双链复制时,新合成的DNA双链呈半甲基化,即保留链会有完整的甲基化标记,新合成链呈非甲基化状态,这时在DNMT1的作用下,以保留链的甲基化位置为指导新合成链甲基化。构建性甲基化是指无须模板指导完成的甲基化,是由不依赖半甲基化模板链而从头合成5-m C的甲基化,其催化酶通常是DNMT3a和DNMT3b。

DNA甲基化在生命过程中扮演着非常重要的功能。在胚胎发育和分化过程中,DNA序列基本不变,但在特异性组织和器官中基因表达有特定模式,这与DNA甲基化有密切关系。甲基化模式建立于配子形成期,并在发育进程中不断变化,通过甲基化与去甲基化维持甲基化模式的动态平衡。此外,DNA甲基化还与其他生命过程,如X染色体失活、管家基因高表达、印记基因组织特异表达、肿瘤发生等相关。X染色体失活能很好地实现体内X染色体上基因表达剂量的平衡;管家基因的低甲基化使其具有持续的表达活性;印记基因的高甲基化使其具有不同于经典孟德尔式遗传方式,在组织中特异表达;DNA甲基化异常可促使肿瘤发生,使癌基因激活,而抑癌基因沉默。表15-1列出了常见肿瘤的甲基化异常基因。因此, DNA甲基化在生命过程中扮演着非常重要的生物学功能。

表15-1 常见肿瘤DNA甲基化异常基因

续表

2.基因印记 对于大多数基因来说,来自父本和母本的等位基因都是同时表达或关闭的。基因印记打破了这种平衡,使来自父本或母本的等位基因选择性地表达。有些印记基因,在来源于父本的基因组中表达,而来源于母本的等位基因不表达;另一些印记基因正好相反。例如,胰岛素样生长因子2基因(Igf2)只表达源自父亲的等位基因,母源等位基因的表达被抑制。相反,源自父亲的胰岛素样生长因子2受体(Igf2r)的等位基因不表达,只表达母源等位基因。基因组印记主要与DNA甲基化、染色质结构、DNA复制时机、非编码RNA的调节有关。基因组印记的主要特点是:①基因组印记遍布基因组,但通常聚集成簇,形成染色体印记区;②印记基因的内含子小,雄性印记基因重组率高于雌性印记基因;③印记基因通常组织特异性表达。

3.组蛋白修饰 组蛋白是染色质的基本成分之一。组蛋白是碱性蛋白质,可以和酸性的DNA紧密结合,在细胞中大量存在,用聚丙烯酰胺凝胶电泳可以将组蛋白分为5种,5种组蛋白又可分为核小体核心组蛋白(H2A、H2B、H3、H4)和核小体连接组蛋白(H1)两大类。核心组蛋白在进化上十分保守,分别由102~135个氨基酸组成,对形成DNA盘绕的核小体结构起关键性作用。

组蛋白共价修饰可影响组蛋白与DNA双链的亲和性,从而改变染色质的松散或密集状态。DNA变松散后,使调控蛋白(如转录因子),可结合到DNA上,DNA变密集后,可妨碍调控蛋白结合。通过染色质松紧程度的变化可调节基因的表达。另一方面,组蛋白共价修饰,还可以通过招募转录因子等到其附近,调控基因转录。组蛋白共价修饰是一种非常精细的基因表达调控。研究得较为深入的组蛋白共价修饰,主要有组蛋白乙酰化和甲基化。常见的组蛋白乙酰化和甲基化修饰位点见图15-2。此外,组蛋白还有磷酸化、泛素化、Sumo化等。组蛋白的各种共价修饰相互协调,并与DNA甲基化一起精确调控基因转录。

组蛋白乙酰化是由组蛋白乙酰基转移酶(histone acetyltransferase,HAT)和组蛋白去乙酰化酶(histone deacetylase,HDAC)协调进行的。HAT可将组蛋白H2A、H3、H4的N端末尾的赖氨酸加上乙酰基,而HDAC的功能正好相反。不同位置赖氨酸的乙酰化修饰需要不同的酶来完成(表15-2)。组蛋白乙酰化通常与基因转录激活有关,乙酰基转移酶家族可作为转录激活因子调控基因表达。去乙酰化酶家族则与染色体易位、转录调控、基因沉默、细胞周期、细胞分化和增殖及细胞凋亡相关。乙酰化修饰大多在组蛋白H3的K9、K14、K18、K23、K27、K56和H4的K5、K8、K12、K16等位点(见图15-2)。

图15-2 组蛋白常见的修饰位点

表15-2 组蛋白乙酰化酶

组蛋白甲基化是由组蛋白甲基转移酶(histone methyltransferase,HMT)和组蛋白去甲基化酶(histone demethylase,HDMT)协调进行的。HMT和组蛋白赖氨酸去甲基化酶见表15-3和表15-4。组蛋白甲基化具有以下特点:①组蛋白甲基化主要发生在赖氨酸和精氨酸上,赖氨酸上的甲基化是可逆的,精氨酸上是否可逆仍不清楚;②组蛋白上赖氨酸和精氨酸的甲基转移酶不同;③组蛋白甲基化修饰对基因表达调控的作用和甲基化位点及甲基化程度有关;④组蛋白赖氨酸残基能够单、双、三甲基化,精氨酸残基能够单、双甲基化,并与其他组蛋白修饰组合极大地增加了甲基化调控的复杂性和灵活性;⑤精氨酸甲基化与基因转录激活有关,而赖氨酸甲基化既可与转录激活有关,又可与转录抑制有关,如H3K4甲基化与基因激活相关,而H3K9和H3K27甲基化与基因沉默有关。甲基化修饰主要在组蛋白H3的K4、K9、K14、K17、K36、K79和H4的R3、K5、K17、K20等位点(见图15-2)。

表15-3 组蛋白甲基转移酶

4.染色质重塑 真核细胞内线性的DNA链必须以染色质形式包装在空间非常狭小的细胞核内。染色质的结构改变与基因的转录、DNA复制、DNA修复、DNA重组及基因表达等基本的生物学过程紧密相关。引起染色质动态变化的主要因素包括ATP依赖的染色质重塑及不依赖于ATP水解的DNA甲基化、组蛋白修饰、染色质构象变化等。

在真核细胞内,为了保证染色质内的DNA与蛋白质的动态结合,细胞内产生了一系列特定的染色质重塑复合物,又称为重塑子(remodeling factor)。重塑子利用ATP的能量通过滑动、重建、移除核小体等方式改变组蛋白与DNA的结合状态,使蛋白质因子易于接近目标DNA。重塑子具有以下特性:①与核小体高度亲和,甚至强于DNA序列与组蛋白的亲和性;②拥有识别共价组蛋白修饰的结构域;③拥有相似的依赖于DNA的ATP酶结构域,该结构域能破坏组蛋白与DNA的接触,也是染色质重塑过程所必需的元件;④拥有可以调控ATP酶结构域的蛋白;⑤拥有可以与其他的染色质或转录因子相互作用的结构域或蛋白质;⑤每类重塑子均包含独特的ATP酶结构域,所有重塑子家族均包含SWI2/SNF2-family ATP酶亚基。

表15-4 组蛋白赖氨酸去甲基化酶

(二)基因转录后的调控

随着功能基因组研究的深入,基因的表达调控研究已经逐渐从单基因调控模式拓展到多基因模式,从单因素研究拓展到多因素协同,甚至向构建系统的调控网络发展。近年来,大量研究表明,基因表达不仅在转录水平受到调控,而且转录后的调控也具有十分重要的意义。转录后调控主要包括lncRNA调控和miRNA调控。

1.lncRNA lncRNA是一类长度超过200核苷酸的RNA分子,它们不编码蛋白质,以RNA的形式在多种层面上调控基因的表达水平。lncRNA来源主要有:①蛋白编码基因的结构中断从而形成一段lncRNA;②染色质重排:即两个未转录的基因与另一个独立的基因融合,从而产生含多个外显子的lncRNA;③非编码基因在复制过程中的反移位产生lncRNA;④局部的复制子串联产生lncRNA;⑤基因中插入一个转座成分而产生有功能的lncRNA。

lncRNA的主要功能有:①通过在蛋白编码基因上游启动子区发生转录,干扰下游基因的表达;②通过抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因表达;③通过与蛋白编码基因的转录本形成互补双链,进而干扰mRNA的剪切,从而产生不同的剪切形式;④通过结合到特定的蛋白质,调节蛋白活性,或改变蛋白的胞质定位;⑤作为结构组分,与蛋白形成核酸蛋白复合体;⑥作为小分子RNA,调控基因转录。目前发现lncRNA与肿瘤等复杂疾病发生有关。

2.miRNA miRNA是在真核生物中发现的一类内源性的具有转录后调控功能的单链非编码RNA,长度为21~25个核苷酸。miRNA从DNA转录而来,但是不翻译成蛋白,由初级转录产物的发夹结构单链RNA前体经过Dicer酶加工而成。miRNA在其产生过程中经历了3种形式的变化:pri-miRNA、pre-miRNA、成熟的miRNA。miRNA与靶基因mRNA之间的配对程度决定了miRNA抑制靶mRNA的方式:当miRNA与靶mRNA之间不完全配对时,miRNA可能通过抑制翻译发挥功能;当miRNA与靶mRNA之间完全配对时,通过类似于siRNA干扰的机制导致靶mRNA的切割和降解。大部分miRNA与靶mRNA之间不完全配对,主要通过影响蛋白表达水平,而不影响靶mRNA的稳定性。miRNA与细胞发育分化、细胞增殖凋亡及疾病发生有关。

三、表观遗传学与医学的关系

表观遗传学是研究在不改变DNA序列的情况下,染色质发生改变,导致基因表达发生变化的分子机制及这种变化在有丝分裂和减数分裂过程中如何遗传给子代。表观遗传调控具有时空特异性、动态可逆调节等重要特征。从表观遗传调控的新视角研究疾病的发生机制,对正确认识肿瘤等复杂疾病发生机制具有十分重要的意义。

目前,研究发现表观遗传调控异常与肿瘤、代谢性疾病、衰老相关疾病、干细胞发育等相关。

(一)表观遗传与肿瘤发生

大量研究表明,表观遗传改变与肿瘤发生密切相关。表观遗传学研究有助于我们加深对肿瘤发病机制的理解,并在肿瘤诊断、预防和治疗等发面发挥重要作用。

DNA甲基化和羟甲基化与肿瘤发生密切相关。甲基化异常可导致基因表达谱异常,使癌基因转录激活,而抑癌基因转录失活,促使肿瘤发生发展。而且DNA甲基化异常通常早于临床病理改变,DNA甲基化异常有望成为肿瘤早期诊断的指标之一。组蛋白修饰在许多人类肿瘤中经常发生变化,阐明肿瘤中组蛋白修饰特征将有助于理解肿瘤发生的分子机制。

miRNA在调节基因表达中具有重要功能,在肿瘤形成过程中经常表达异常,进而导致其靶基因表达异常。miRNA在肿瘤的分子分型、预后或治疗中均起重要作用。表观遗传学还可用于癌症治疗,针对表观遗传催化酶,如DNMT、HAT、HDAC、HMT及HDMT等的药物已取得重要进展。有些表观遗传药物通过与其他药物相互作用,功能进一步增强,而且具有低毒性的重要特点,受到肿瘤治疗专家的关注。

(二)表观遗传与代谢性疾病

在代谢性疾病发展过程中,表观遗传调控起到重要作用。糖尿病和肥胖是代谢性疾病的两个重要标志性病变,是与基因印记变化密切相关的综合征。父系功能的丢失或母系功能丢失均与肥胖倾向相关。在妊娠过程或生命初期,通过营养或生活方式干预会影响DNA甲基化和组蛋白修饰,从而可早期对肥胖症进行干预或控制。2型糖尿病与DNA甲基化密切相关,研究发现DNA甲基化在糖尿病与非糖尿病个体中存在明显差异。组蛋白去乙酰化酶抑制剂是治疗糖尿病的潜在药物。

(三)衰老及其相关疾病中的表观遗传

衰老不仅影响生物体的生理健康,而且它倾向于引发一系列与年龄增长有关的疾病。表观遗传改变是老龄化的主要原因,并可导致各种疾病发生。虽然衰老本身并不被认为是疾病,但它也许是最常见的病因。因此,通过表观干预和治疗延缓与衰老相关的表观遗传学变异,可能对人类疾病的发生发展产生巨大影响。尽管早期发育过程与衰老位于寿命谱的前后两侧,早期发育过程与衰老及其相关疾病仍然联系紧密。营养物质、激素分泌和生命早期代谢环境的作用,可能影响整个生命过程。生命早期表观遗传的影响及其后续结果现已引起人们的广泛研究兴趣。

(四)人类疾病中的干细胞表观遗传

以干细胞为基础的治疗方法可能可以有效治疗疾病,而表观遗传调控在干细胞分化和维持多能性过程中起到重要作用。染色质修饰及动力学改变对维持胚胎干细胞多能性和分化能力十分重要。事实上,一些表观遗传学疾病模型是通过将患者的细胞在体外诱导为多能干细胞(i PS细胞)而建立起来的。了解这些过程中的关键表观遗传学改变对于理解疾病的发病机制和指导治疗具有重要意义。非编码RNA也参与了干细胞的更新和分化。表观遗传学和非编码RNA可以为干细胞重编程提供许多有用的工具,并可应用到疾病的治疗中去。

四、表观遗传学的数据资源

随着表观遗传学研究的深入,表观遗传学研究受到各国科学家的极大重视。继人类基因组计划之后,国际上出现了许多表观遗传学的研究计划。其中具有较大国际影响力的研究计划如下。

(一)国际人类表观基因组计划

DNA甲基化所致基因表观遗传学转录失活已经成为肿瘤表观基因组学研究的重点内容。基因组水平上研究DNA甲基化模式对于肿瘤疾病的诊断、治疗和预后判断具有重要的实用价值。为此,人类表观基因组协会(HEC)于2003年宣布正式启动的人类表观基因组计划(human epigenetics project,HEP)。HEP项目旨在鉴定和分类人类基因组中甲基化变异位点。应用重亚硫酸盐、基因组测序等技术,分析比较疾病和正常两种状态下,DNA甲基化变化特征。HEP的实施标志着人类表观基因组学研究又跨上了一个新台阶。HEP网址是http://www.epigenome.org/。

(二)ENCODE计划

DNA元件百科全书(encyclopedia of DNA elements,简称ENCODE计划)是一个由美国国家人类基因组研究所在2003年9月发起的一项公共联合研究项目,旨在找出人类基因组中所有的功能元件。这是完成人类基因组计划后国家人类基因组研究所开始的最重要的项目之一。所有在该项目中产生的数据都会被迅速地在公共数据库中公开。2012年9月5日,该项目的初步结果被整理为30篇论文并发表于《自然》、《基因组生物学》及《基因组研究》中。这些发表的论文显示人类基因组内的非编码DNA至少80%是有生物学活性的,而不像之前认为的仅仅是“垃圾”。这个结果非常重要,因为人类基因组中98%的DNA是非编码的,意味着它们并不直接编码任何蛋白质序列。ENCODE计划网址是http://genome.ucsc. edu/ENCODE/。

(三)Roadmap表观基因组计划

2007年,美国国家卫生研究所(NIH)发起了Roadmap表观基因组计划。该项计划的研究目标是发展各种细胞系和组织的表观基因组公共参考图谱。这些表观基因组图谱主要用于提供研究人类发育、多样性和疾病中表观遗传学事件的公共资源。类似于Encode计划,科学家在Roadmap表观基因组计划中也做了很多的努力,Roadmap表观基因组计划和ENCODE计划也可相互作为一个非常好的补充。Roadmap表观基因组计划网址是http://www.roadmapepigenomics.org/。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈