首页 百科知识 真核基因组的结构特点

真核基因组的结构特点

时间:2022-09-29 百科知识 版权反馈
【摘要】:真核生物的这些特点使得真核细胞基因组的结构与功能表达比原核生物更加复杂而多变。进一步的研究证实,在小鼠基因组中这种重复序列长度约为300个碱基对,重复拷贝数为106。在人的基因组DNA中,有30%的DNA至少重复20次,最多的高达5×105次。绝大多数真核细胞蛋白质是由单拷贝基因编码的。

真核生物基因组的遗传信息远比原核生物的多。比如,人类细胞含有的DNA数量相当于大肠杆菌的1 000倍,相当于λ噬菌体的105倍。这使得真核细胞拥有原核生物无可比拟的遗传信息。与原核细胞DNA的裸露状态不同,真核细胞的DNA是和蛋白质,特别是和碱性蛋白相结合,并经过多层次浓缩包裹的,染色体就是这种高级结构的一种形式(图4-11)。

细胞周期的不同阶段,染色体形态的有规律变化反映了这种高级结构的解聚和重建过程是高度有序、严格受控的。真核细胞和原核细胞的另一个区别是真核细胞的染色体组是由核膜包裹的,这层核膜把真核细胞的基因转录和翻译在时间和空间上都分割开来了。高等真核生物细胞核内合成的RNA要经过广泛的修饰、切割和拼接才能成熟,而且只有少数核内RNA会透过核膜进入细胞质作为mRNA来指导蛋白质的合成。真核生物的这些特点使得真核细胞基因组的结构与功能表达比原核生物更加复杂而多变。然而,由于DNA重组技术的发展,已有可能分离和克隆特定的真核生物基因,并有可能做核苷酸序列分析,真核基因组结构和功能表达的研究也因此取得了长足的进步。人类认识高等生物的分化、免疫、癌变等现象的大门正是从这里打开的。

我们可以从五个方面来说明真核基因组的结构特点。

(1)齐姆(B.Zimm)等在1974年用黏弹性技术(viscoelastic technique)证实每个真核细胞的染色体只含有一个DNA分子,也就是说每条染色体中的DNA是一个连续而完整的大分子。

(2)真核细胞的染色体是由DNA和组蛋白构成的核蛋白组成,称为染色质。组蛋白有五类,其组成特点如下:

图4-11 真核生物染色体结构层次示意

组蛋白含有大量的赖氨酸精氨酸,这两种碱性氨基酸的总量约占全部氨基酸含量的1/4。碱性氨基酸都带有携正电荷的侧链,这些侧链可经化学修饰而使组蛋白产生不同的形式,其中乙酰化、甲基化、ADP-核糖基化、磷酸化等修饰属共价修饰。这些化学修饰会改变组蛋白的负电量和氢键形成能力,乃至改变整个分子的构型。这些变化在调节DNA复制和转录中起着要重的作用。

(3)科恩伯格在1974年提出了核小体(nucleosome)是构成染色质纤丝的基本单位的理论。他根据大量的实验研究提出,每个核小体由一段长度为146个碱基对的DNA,加上H2A、H2B、H3和H4各两分子组成。大部分DNA缠在由组蛋白组成的8聚体核心外面,余下的DNA连接相邻的核小体,并使染色质纤丝有一定的弹性(伸缩性)。也就是说,染色质纤丝是由核小体组成的、具有弹性的真核生物染色体的基本结构单位。电镜观察、X射线衍射分析、中子衍射分析、核酸酶降解分析,以及组蛋白和来自SV40病毒或腺病毒的DNA的核小体重组实验,都证实了科恩伯格的核小体模型是正确的。图4-12是核小体的模式图。

图4-12 核小体结构示意(引自A.Komberg)

组蛋白H2A、H2B、H3和H4组成8聚体核心,外缠DNA。组蛋白H1在核心外并和连接段DNA相结合。

(4)真核基因组中有许多重复的核苷酸序列。这是布里藤(R.Britten)和克内(D.Kohne)在1968年的一项重大发现。

布里藤是在研究热解聚后的DNA分子重聚动力学的时候发现重复序列的。根据热力学定律,在一定条件下热解聚后分子的重聚速率是溶液中同源单链DNA片段的浓度的函数,即:

式中,C是同源单链DNA片段的摩尔浓度;t是反应的时间;K是反应常数。变换上式:

分别对C和t取积分:

运算后得:

再经简化可得到在时间t时的同源单链DNA片段的即时浓度和起始时同源单链DNA片段的浓度之比:式中,C是时间t时溶液中尚余的同源单链DNA片段浓度;C0是反应开始时,即t0时的同源单链DNA片段浓度;t是反应开始到取样时的时间间隔;K是反应常数。这个反应方程表明,在任何一个时间点,反应系统中的同源单链DNA片段的浓度C与反应起始时的同源单链DNA片段的浓度C0的比值是C0和反应时间t乘积的函数。C0的单位是mol/L,t的单位是s,所以C0t的单位是mol· s/L。

若以起始浓度和反应时间的乘积C0t为自变量,以即时浓度和起始浓度的比值C/C0为应变量作图,可得图4-13的C0t曲线。从S形的C0t曲线可求出C/C0= 1/2时的C0t1/2。C0t1/2是一个非常有用的实验参数,它相当于一半同源单片段重聚成为双链时的C0t值。从图4-13可知大肠杆菌DNA的C0t1/2为9 mol· s/L,噬菌体T4 DNA的C0t1/2为0.3 mol· s/L。这两个数值表明大肠杆菌DNA解聚后的重聚速度是T4的1/30。这是因为大肠杆菌DNA比T4 DNA的分子量大,解聚和离心剪切后的单链片段溶液中结构互补的同源片段的浓度远比T4来源的样本低的缘故。

图4-13 不同DNA分子重聚动力学研究测得的C0t曲线(改自R.J.Britten和E.Kohne)

用C0t曲线分析各种不同来源的DNA的重聚动力学的一个出人意料的发现是,哺乳动物基因组DNA有两种组分:一种组分的C0t1/2为104 mol· s/L,另一种为10-3 mol· s/L,两者相差达107之多。如果我们用10-4mol·s/L的DNA溶液做C0t1/2测定,其中90%的哺乳动物DNA达到半数重聚的时间是108 s(约为三年),而另外10%DNA的半数重聚时间只有10s。哺乳动物细胞基因组DNA所含碱基对数目相当于大肠杆菌的103倍,它的C0t1/2数值大是意料之中的,但在哺乳动物基因组中发现重聚速度比分子量最小的病毒DNA快100倍以上的组分是一个极为重要的新发现。重聚动力学研究表明,这部分DNA有许多重复拷贝。进一步的研究证实,在小鼠基因组中这种重复序列长度约为300个碱基对,重复拷贝数为106。随后发现各种真核生物基因组中,都有重复程度不同的重复序列。在人的基因组DNA中,有30%的DNA至少重复20次,最多的高达5×105次。在各种真核生物中重复序列(包括高度重复和中等程度重复序列)和单拷贝序列在基因组DNA中所占的比例是各不相同的。

绝大多数真核细胞蛋白质是由单拷贝基因编码的。例如,蚕的单倍体基因组有一个拷贝的丝蛋白基因(silk fibrongene),定量分析表明,这个基因可作为104个mRNA分子的转录样板,每个mRNA分子又可编码105个蛋白质分子。这样,一个基因在3~4 d的结茧期中可编码合成109个丝蛋白分子,这是结构基因中比较典型的例子,但也有另一类极端的例子。曾经发现生物机体为了促进某种特殊蛋白质的合成,在行使专门功能的细胞中有可能选择性地扩增基因。例如,某些对甲氨蝶呤或其他叶酸结构类似物有拮抗性的肿瘤细胞能合成比敏感细胞多200倍的双氢叶酸还原酶(DHFR)。这种合成剧增的原因是这些肿瘤细胞的DHFR基因扩增了许多拷贝。由此可见真核基因组是一个高度能动的结构/功能系统。

(5)真核基因组的另一个特点是,真核生物的结构基因往往并不是由连续的编码序列组成的,而是在编码序列中间插入了许多间隔序列。这些不编码氨基酸的间隔序列称为内含子(intron),而编码蛋白质结构的序列称为外显子(extron或exon)。基因的这种割裂结构或称为割裂基因(splitgene)的发现,是DNA结构研究的重大进展。内含子和重复序列的发现为研究真核基因的结构和功能开拓了新的道路,它和任何一次遗传学上的重大发现一样,带来了基因概念的新发展。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈