首页 理论教育 人类基因组结构与变异

人类基因组结构与变异

时间:2022-04-16 理论教育 版权反馈
【摘要】:人类基因组DNA 70%~80%是基因外DNA,且一般都是高度重复和中度重复。此类序列约占整个基因组序列的10%。目前发现有核心序列为3 bp的STR存在于基因编码序列内。据研究,在人类基因组中有5万~10万个STR基因座,平均20 kb就出现1个,其等位基因长度在100~300 bp。此类多态性分布广泛,在基因组编码区和非编码区内均有存在。

二、人类基因组结构与变异

基因组(genome)是指一个单倍体细胞的所有DNA,或者一个双倍体细胞DNA组成的一半。原核生物基因组就是原核细胞内构成染色体的1个DNA分子,真核生物基因组包括细胞核基因组和细胞器基因组,在人类中就是细胞核基因组和线粒体基因组。

(一)人类基因组的结构

基因组DNA总长度约3×109bp(碱基对),现已查明其含有2万~2.5万个基因。根据DNA序列特征,可以把基因组DNA分为单一序列DNA和重复序列DNA。人类基因组DNA 70%~80%是基因外DNA,且一般都是高度重复和中度重复。20%~30%属于基因或基因区域内的单一序列DNA,其中外显子编码序列的比例少于10%。

1.单一序列单一序列(unique sequence)又称为非重复序列或单拷贝序列,多为编码蛋白质(包括酶)的结构基因。

2.重复序列因为含的A,T或G,C的比例较高,在氯化铯(cesium chloride,CsCl)密度梯度离心时,这类序列的位置是在DNA主带的两侧,像DNA主带的卫星而得名。因而,重复序列属于卫星DNA。按其重复程度,又可以分为下列3种。

(1)轻度重复序列(slightly repetitive sequence)指1个基因组内有2~10份拷贝,但有时2~3份拷贝的DNA序列也被视做非重复序列。例如,组蛋白基因、人的珠蛋白(血红蛋白)基因、癌基因都属于轻度重复序列。

(2)中度重复序列(intermediate repetitive sequence)这类序列通常是非编码序列,在长度和拷贝数上有很大的差别。但也包括一些蛋白质基因和RNA基因,如免疫球蛋白基因以及rRNA基因和tRNA基因。

中度重复序列又可分为2种类型:一种是短分散重复序列,长度300~500 bp,例如Alu家族由300 bp的短序列组成。在1个基因组中有30万~50万份的拷贝,其作用可能与转录调节、DNA复制启动以及hnRNA的加工有关。另一种是长分散重复序列,长度5.0~7.0 kb,例如KpnⅠ家族,长度6.5 kb,拷贝数3 000~4 800个,其功能不详。

(3)高度重复序列(highly repetitive sequence)是一种简单的重复序列,通常由很短的重复单位(repetitive unit,也称核心序列,core sequence)串联组成,长度为2~300 bp,在基因组中重复可达数十万次。这类序列又称为卫星DNA(satellite DNA),散在分布于整个基因组。

(二)群体中基因组的变异与多态性

对于单一个体而言,其染色体DNA序列是个体特异性的,终生不变,并按孟德尔规律世代相传。其中线粒体DNA则按母系规律遗传。

按照DNA序列特征,可以将DNA多态性分为长度多态性和序列多态性两大类。但是,长度多态性也属于序列多态性。

1.DNA片段长度多态性(DNA fragment length polymorphism)这是一类重复序列,同一基因座的不同等位基因之间,因核心序列的重复次数有变异,因而等位基因片段的长度不同,故这类序列又称为数目可变的串联重复序列(variable number of tandem repeats,VNTR)。它包括小卫星(minisatellite)DNA和微卫星(microsatellite)DNA。

(1)VNTR序列习惯上将这类序列特指小卫星DNA,其核心序列为10~100 bp,不同等位基因的重复次数变化很大。在所有染色体上均有分布,多位于染色体近端粒区,但也可分散在基因组的其他位置。此类序列约占整个基因组序列的10%。

(2)STR(short tandem repeats,STR)序列属于微卫星DNA的一类VNTR序列,其核心序列常为2~6 bp,不同等位基因的重复次数为10~60次,在内含子及基因间隔区内多见。目前发现有核心序列为3 bp的STR存在于基因编码序列内。据研究,在人类基因组中有5万~10万个STR基因座,平均20 kb就出现1个,其等位基因长度在100~300 bp。

(3)大片段重复序列最具代表性的就是CNV(copy number variations)序列。2003年以来,研究发现某些DNA片段的长度有从kb至Mb规模的变异。这些变异可以是片段的缺失、插入、重复和复合性的变异,被称为拷贝数变异序列或拷贝数多态性。

2.DNA序列多态性(sequence polymorphism)它是指同一个基因座的不同等位基因或不同基因组DNA序列的同一位置上的碱基序列出现个体差异。此类多态性分布广泛,在基因组编码区和非编码区内均有存在。在法医学领域中应用广泛的是线粒体DNA非编码区的序列多态性、某些编码基因(如ABO血型基因、HLA系统基因等)的多态性和人类基因组SNP(single nucleotide polymorphism,单核苷酸多态性)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈