首页 理论教育 人类基因的结构

人类基因的结构

时间:2022-02-11 理论教育 版权反馈
【摘要】:调控区域中的启动子引导RNA聚合酶与基因的正确部位结合,启动转录。图1-2 割裂基因的结构(一)外显子与内含子对人类基因组目前的研究成果的分析表明,人类基因的平均长度为27kb。不同的基因由于大小的不同,所含的外显子与内含子的数目及大小有很大的差异。
人类基因的结构_分子医学导论

一、人类基因的结构

分别提出割裂基因这一概念的科学家是RJ Roberts和PA Sharp,他们也因此获得了1993年诺贝尔医学奖。一般而言,一个基因包括:转录调控区域、转录区和终止子(基因下游3′端不转录的核苷酸序列)。以β珠蛋白基因为例(图1-2),图1-2a、b示基因控制区域,可以调控基因的转录;图1-2c外显子的突变可导致失活变异蛋白的出现,图1-2d内含子的突变可能导致剪接的错误从而编码没有功能的蛋白质。调控区域中的启动子引导RNA聚合酶与基因的正确部位结合,启动转录。而终止子具有终止RNA聚合酶继续移动的功能。其中转录区分为编码区和非编码区。编码区包括1个起始密码子(通常是AUG)、编码密码和1个终止密码子(UAA、UAG或UGA)。非编码区(转录不转译区域)位于编码区两侧:包括5′非翻译区(5′untrans-lated region,5′UTR)(含1个核糖体的结合位点和1个转录起始信号)和3′非翻译区(3′UTR)(含有1个转录终止信号)以及编码区中的间隔区域称为内含子(转录不转译区域)。

img4

图1-2 割裂基因的结构

(一)外显子与内含子

对人类基因组目前的研究成果的分析表明,人类基因的平均长度为27kb。外显子的平均数目为8.8个,平均长度为145bp;内含子的平均长度为3365bp,外显子与内含子在基因中相间排列。外显子长度一般不超过800bp,内含子的长度变化较大,从30bp或更少至数十kb不等。不同的基因由于大小的不同,所含的外显子与内含子的数目及大小有很大的差异。DMD(duchenne muscular dystrophin)基因长约2400kb,有80个外显子,而有少数基因如组蛋白、α-干扰素等则不含内含子,即只有1个外显子。人类甲型血友病的Ⅷ因子的基因全长186kb,由26个外显子和25个内含子组成,外显子长度从69bp到3106bp不等,内含子长度从207bp到32.4kb不等。

每个外显子和内含子的接头区都有一段高度保守的序列,一般内含子的5′端起始处有GT序列,3′端尾部有AG序列,称为GT-AG法则(GT-AG rule)。外显子内含子接头的保守序列几乎存在于所有高等生物的基因中,说明在切除内含子、拼接外显子的过程中存在着共同的剪接加工机制。

割裂基因的外显子和内含子的区分不是固定不变的,由于存在剪接加工方式的不同,可能使基因的内含子在另外一种剪接形式下成为外显子,甚至有些基因的内含子中存在着另一个基因。

另外,由于DNA是双链,因此可能会出现互补的双链分别作为两个基因的编码序列,如ear-1和ear-7基因都位于17号染色体,拥有重叠的外显子,但分别从互补链反向转录。这种情况在高等生物中比较少见。

(二)前导区和尾部区

真核基因的5′端转录起始点与翻译密码起始点之间的核酸序列是不编码蛋白质的,称为前导区或5′UTR,3′端翻译终止密码到转录终止点之间的序列称为尾部区或3′UTR。5′UTR序列对mRNA的翻译起着重要的调控作用,如5′端加工后产生的帽子结构(m7GpppN)能够显著提高翻译效率,5′UTR的序列对起始AUG的选择也有影响。3′UTR主要含有终止信号及加尾信号。

(三)侧翼序列

真核基因转录区的两侧称为侧翼序列,有一些重要的调控序列,包括启动子和增强子等。

1.启动子 启动子(promoter)包括下列几种不同序列,能促进转录过程:①TATA序列,在mRNA结构基因上游25~30个核苷酸处,有一富含TATA的序列,有人称为TATA框(TATA box)。RNA聚合酶Ⅱ能准确识别TATA序列,并与之结合形成启动复合物,从而引发开始合成mRNA。但还发现一些基因不含TATA序列也能转录,可能还存在着与TATA序列功能相似的其他序列;②CAAT框(CAAT box),其基本序列为GGGTCAATCT,是真核生物基因常有的调节区,位于转录起始点上游-100~-80bp处,可能也是RNA聚合酶的一个结合处,控制着转录起始的频率;③GC框(GC box),其共有序列为GGCGGG,有两个拷贝,位于CAAT框的两侧,是一个转录调节区,有激活转录的功能,可能与增强起始转录的效率有关。

此外,RNA聚合酶负责转录tRNA的DNA和5SrDNA,其启动子位于转录的DNA序列中,称为下游启动子。

2.增强子 增强子(enhancer)是一段能够增强转录作用的DNA序列,它不能启动一个基因的转录,但能明显地提高基因转录的效率。增强子可位于基因的上游或下游,甚至有时会出现在基因内部(内含子中),在离启动子几至几十千碱基对远处也可发挥作用。此外,增强子序列可与特异性细胞因子结合,从而表现出组织特异性,对基因表达有组织、器官、时间不同的调节作用。例如人类胰岛素基因5′末端上游约250bp处有一组织特异性增强子,在胰岛β细胞中有一特异因子可作用于该区以增强胰岛素基因的转录和翻译,其他组织中无此因子,这是胰岛素基因只有在胰岛β细胞中才得以很好表达的原因。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈