首页 理论教育 人类基因组及其分类

人类基因组及其分类

时间:2022-04-14 理论教育 版权反馈
【摘要】:人类的所有遗传信息构成了人类基因组,即每个体细胞中的所有DNA,包括父源和母源2个基因组。人类基因组中60%~70%是单拷贝或低拷贝的DNA序列,其中有编码蛋白的基因。这类DNA可以经密度梯度离心后,在基因组DNA主峰旁形成小沉淀带而与主体DNA分离开来,故称为卫星DNA。如Alu家族,是人类基因组中特有的含量丰富的中度重复序列,由300bp的短序列组成。因为受精卵的线粒体来自卵细胞,故mtDNA为母系遗传。

人类的所有遗传信息构成了人类基因组(genome),即每个体细胞中的所有DNA,包括父源和母源2个基因组。每个基因组的DNA约有3.0×109bp。人类基因组中60%~70%是单拷贝或低拷贝的DNA序列,其中有编码蛋白的基因。30%~40%是中度或高度重复DNA序列,将基因分隔开。

人类基因组可分为以下几类。

1.单一序列(solitary gene) 人类基因组中有2万~2.5万个编码特异蛋白质基因,分布在23对染色体的不同区域,其中许多基因为单拷贝的单一序列,它们编码维系细胞功能的重要物质,如酶、激素、受体、结构蛋白和调节蛋白等。

2.多基因家族(multigene families) 多基因家族有2类,一类是1个基因的多次拷贝、序列高度同源,成簇地排列在同一条染色体上,形成1个基因簇,这些基因可能同时发挥作用,或在不同发育阶段表达合成某些蛋白。如β-类珠蛋白基因簇包含5个功能基因,位于11号染色体短臂上。另一类为超基因家族,不同基因成簇地分布在几条不同的染色体上,它们的序列有所不同,但是编码一类功能相关的基因。如HOX基因由38个功能相关基因组成4个基因簇,分布在2、7、12和17号染色体上。

3.假基因(pseudogene) 指与某些有功能的基因结构相似而不能表达基因产物的基因,如人β-类珠蛋白基因簇至少存在2个DNA区域与有功能的β-珠蛋白基因相似但没有功能的DNA顺序,因为没有相应于这些区域的蛋白质发现,这些DNA顺序被称为假基因。假基因起初可能是有功能的基因,由于DNA顺序的不断变化(如缺失、倒位或点突变等),导致了或使翻译终止,或使mRNA加工阻断的顺序积累,致使这些DNA区域丧失功能。

4.串联重复序列 编码45SrRNA、5SrRNA、各种tRNA及组蛋白家族成员的基因在基因组中是以串联重复排列存在的,即在较长的DNA内,同一基因顺序的若干拷贝常常以首尾相接的方式逐个排列。在1个编码rRNA或tRNA串联重复序列内,1个基因准确地或几乎准确地相同于其他基因拷贝。在1个已知个体内,这些rRNA基因的转录部分相同,但非转录间隔部分可能有变化。编码组蛋白的基因串联排列稍微复杂,但每种组蛋白基因也有多个相同的拷贝。

5.重复序列 除了编码rRNA、tRNA、组蛋白的重复基因序列之外,在真核生物基因组中还有许多重复的DNA顺序,它们并不编码任何蛋白质及RNA。包括以下2类。

(1)高度重复DNA:这类重复顺序由以串联形式重复许多次的寡聚核苷酸组成,又称为简单顺序DNA,绝大部分的简单顺序DNA由5~10个bp的寡聚核苷酸串联重复组成,但在脊椎动物基因组中也发现20~200bp的串联重复单位。这类DNA序列可分为:①卫星DNA,是由一系列短串联重复DNA序列组成,聚集在某些染色体的着丝粒周围。这类DNA可以经密度梯度离心后,在基因组DNA主峰旁形成小沉淀带而与主体DNA分离开来,故称为卫星DNA。②小卫星DNA,在人类由15~100个寡聚核苷酸组成的重复单位,重复20~50次形成的1~5kb的短DNA,叫小卫星DNA。包括端粒DNA和高变小卫星DNA 2种。由于个体间小卫星长度的变化,用分子杂交的方法,以少量小卫星DNA为探针即可探测不同个体的小卫星DNA之间的细微差别,因此可以用作DNA指纹印记的多态性标记,是一种新的DNA指纹分析方法。③微卫星DNA,由2~6个核苷酸的重复序列组成的短串联重复序列(short tendem repeats,STR)。微卫星DNA有较高的多态性,即某个短串联重复顺序(STR)在不同个体中可能由不同数目的重复顺序组成;微卫星DNA的另一特点是其“高频率”,即遍布于基因组。而且微卫星DNA序列较短,可以方便快速检测,因而可成为有用的遗传标记,在基因诊断以及疾病相关基因定位等方面得到了广泛的应用。

(2)中度重复DNA:中度重复序列在长度和拷贝数上有很大差别,可分为2类:①短分散元件,占人类基因组的7%,长度300~500bp,拷贝数目可达75万以上。如Alu家族,是人类基因组中特有的含量丰富的中度重复序列,由300bp的短序列组成。每个Alu序列中含有一个限制酶Alu的识别部位,可被切割成170bp和130bp 2个片段。Alu遍布于人类基因组,平均每隔3kb就有一个Alu重复序列,Alu序列常位于基因的非编码区域,可能与基因表达调控有关。②长分散元件,占人类基因组的5%,长度5 000~7 000bp,拷贝数在20万~50万。如LINE-1元件,在人类基因组中有6万个拷贝,编码一个反转录酶,基因组中平均每隔50kb就有一个LINE-1重复。

6.线粒体DNA 除了细胞核DNA外,每个细胞中的数千个线粒体都有自己的闭环双链DNA,即线粒体DNA(mitochondrial DNA,mtDNA)。mtDNA长度16kb,遗传信息略不同于核DNA,结构紧凑,几乎没有重复的DNA序列。线粒体DNA编码2个rRNA、22个tRNA和多种酶的蛋白亚单位,主要是与呼吸链有关的一些必要成分,例如细胞色素B还原酶和细胞色素C氧化酶等。因为受精卵的线粒体来自卵细胞,故mtDNA为母系遗传。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈