首页 理论教育 人类基因组计划的内容

人类基因组计划的内容

时间:2022-04-14 理论教育 版权反馈
【摘要】:人类基因组计划内容涉及人类结构基因组学、人类功能基因组学、比较基因组学、疾病基因组学等多方面研究。现阶段对于人类结构基因组学的认识,就是“人类基因组计划”取得的重要技术成果。在整个人类基因组中,只有1%~5%的DNA序列为编码序列。③它能为估计人类基因的数目提供较为可靠的依据。4.序列图 完成人类基因组3×109的核苷酸序列图,也是最高层次的和最详尽的物理图,是人类基因组计划最终要实现的确定目标。

人类基因组计划的技术目标,是建立人类基因组的结构图谱,即连锁图、物理图、转录图与序列图,并在制图测序的基础上鉴定人类的基因,绘出人类基因图。从1990年到2004年,HGP计划的重点在于研究人类基因组的结构——人类结构基因组学研究;在基因结构研究的基础上,HGP计划将致力于阐明人类所有基因的功能——功能基因组学研究;HGP计划最终还要阐明地球上所有物种的基因组结构,研究其功能的异同与关系——比较基因组学研究。人类基因组计划内容涉及人类结构基因组学、人类功能基因组学、比较基因组学、疾病基因组学等多方面研究。

(一)人类结构基因组学

现阶段对于人类结构基因组学的认识,就是“人类基因组计划”取得的重要技术成果。这一成果,集中反映在连锁图、物理图、转录图、序列图,以及在此基础上的“基因图”的建立。

1.连锁图 连锁图(linkage map)又称遗传图(genetic map)。它是以具有遗传多态性的遗传标记为“路标”,以遗传学距离(在减数分裂事件中,2个位点之间进行交换重组的百分率为1%时的遗传距离称1厘摩,cM)为图距的基因组图。

经典的遗传标记是当时以电泳或免疫技术可以检出的蛋白质标记。如红细胞ABO血型座位标记,白细胞HLA座位标记等。DNA技术的建立提供了新的更有应用价值的遗传标记。

第一代DNA遗传标记是限制性片段长度多态(RFLP)。DNA序列的改变,甚至于一个核苷酸的变化,就可能引起某个限制酶切点的丢失或产生,导致酶切片段长度的变化,这可用常规的琼脂糖凝胶电泳检出。由于核苷酸序列的改变遍布于整个基因组,特别是进化中选择压力不很大的非编码序列之中,因而RFLP的出现频率很高,满足了遗传标记的“多态性”与“高频率”的要求。1987年Dinis-Keller等人建立了人类第一张以RFLP为遗传标记的“连锁图”。

第二代DNA遗传标记是微卫星(microsatellite,MS)或短串联重复顺序(short tandem repeat,STR)。主要是二核苷酸重复序列如(CA)n,其染色体分布和信息含量明显优于RFLP,成为遗传连锁分析极其有用的标志。1996年法国和美国科学家共同努力,发表了由5 264个MS标志组成的、分辨率高达0.6cM的连锁图谱。

第三代DNA遗传标记是单个核苷酸多态性(SNP)。SNP是指基因组内特定核苷酸位置上存在2种不同的碱基,其中最少一种在群体中频率不小于1%。尽管就单个SNP而言只有2种变异体,变异程度不如微卫星或小卫星DNA,但SNP在基因组中数量巨大,分布频繁,因此就整体而论,它们的多态性要比微卫星DNA高得多。而且由于SNP是二态的,易于自动化批量检测,因而被认为是第三代遗传标记。SNP与RFLP和STR等DNA标记的主要不同,是SNP不再以“长度”的差异作为检测手段,而直接以序列的变异作为标记。SNP作为多态性标志,其意义已超出了遗传作图的范围,而成为研究基因组多样性和识别、定位疾病相关基因的一种新型手段。

2.物理图 基因组物理图(physical map)是对染色体DNA的直接分析,通过这种分析确定DNA片段的实际排列顺序。它是以一段核苷酸序列的DNA片段(如STS)为“位标”,以Mb或kb作为图距的基因组图。物理图包含了2层意义,一是获得分布于整个基因组的序列标签部位(sequence tagged site,STS),其定义为染色体定位明确而且可用PCR扩增的单拷贝序列,使每隔一定距离就有一个标志;二是在此基础上构建覆盖每条染色体的大片段DNA邻接克隆系,确定两个相邻STS间的物理联系。1998年底的物理图已包括52 000个STS,大大超过了原定30 000个STS的目标。物理图构建的成功,不仅为大规模测序奠定了基础,而且还绘制出了人类基因组转录图(或基因图)的雏形。

3.转录图 转录图或称cDNA图,即在基因组上确定与全部mRNA相对应的DNA顺序位置,它是以表达序列标签(EST)作为位标,鉴定基因的全长。所有生物的性状(包括疾病),都是由蛋白质确定的,而已知的所有蛋白质都是由带有多聚A“尾巴”的mRNA依照“遗传密码”编码的。在整个人类基因组中,只有1%~5%的DNA序列为编码序列。在人体特别是成年个体的每一特定组织中,细胞内一般也只有10%的基因是表达的。如果把mRNA(或据mRNA人工合成的cDNA)先分离、定位,就可将基因组中可转录的DNA顺序确定下来,这就抓住了基因的主要部分(可转录的部分)。所以,一张人类的转录图即表达序列标签(EST)组成的“表达序列图”,就是人类“基因图”的雏形。现阶段,转录图与EST还有多方面的现实意义:①转录图可以了解同一基因在不同组织、不同时间的表达水平;以及特定时间内,不同的基因在不同组织中的表达水平。②可提供鉴定基因的探针或直接作为基因诊断的探针。③它能为估计人类基因的数目提供较为可靠的依据。

4.序列图 完成人类基因组3×109的核苷酸序列图,也是最高层次的和最详尽的物理图,是人类基因组计划最终要实现的确定目标。测序技术包括大片段基因组文库构建、DNA测序片段序列组装以及结合物理图谱和连锁图谱的基因结构分析。

2001年2月,国际人类基因组测序协作组(IHGSC)发表了覆盖人类基因组95%的工作框架图,称为公共序列(public sequence)。此后,IHGSC还陆续发表了关于第5、6、7、9、10、13、14、19、20、21、22号染色体和Y染色体的详细评注和分析。2004年10月,由6个国家20个研究所(或中心)组成的IHGSC在Nature上发表了包括28.5亿个碱基、覆盖率大于99%、误差小于十万分之一的人类全基因组高精度序列图,标志着人类基因组计划的最终完成。

5.基因图 人类基因组计划要完成的另外一个重要目标是在人类基因组中找出全部基因的位置、结构与功能,即绘制基因图。

2004年10月,IHGSC测定了人类全基因组的精细序列图,最终估计人类基因组中编码蛋白质的基因数目仅有2万~2.5万个,大约占人类基因组序列的1.5%。尽管有些基因的功能目前无法确定,但明确基因组中每个基因的序列本身已经是一件非常有意义的工作,这将为异常或致病基因的克隆提供快速识别途径和研究策略,加快重大疾病遗传机制的发现,并可对遗传病的治疗和控制提供战略性的指导。

值得关注的是,中国于1999年9月加入IHGSC,获得了人类3号染色体短臂区域(3pter-D3S3610)约30Mb的测序任务,约占人类基因组的1%,是加入IHGSC的惟一一个发展中国家。到2000年5月30日,由中科院遗传所人类基因组中心暨华大基因研究中心和国家人类基因组南、北方中心共同承担的此项测序任务已圆满完成。中国参与国际人类基因组计划改变了国际人类基因组研究的格局,把我国的人类基因组计划(HGP)融入世界人类基因组的研究中,使中国有权分享国际人类基因组研究的全部成果与数据、资源与技术,对有关事务有了发言权,并建立了中国的基因组研究基地。

(二)功能基因组学

结构是功能的基础。“人类基因组计划”的成果所提供的对人类基因组结构的认识,为进一步了解人类基因组的功能奠定了基础。

功能基因组学,就是在基因组的层次上,研究所有基因的表达、调控与功能。其主要内容包括:建立单核苷酸多态性为代表的DNA序列变异的系统目录,从而揭示人类疾病和其他生物学性状(对药物的反应性等)的遗传学基础;认识基因组在转录和翻译水平的表达及其调控机制;通过对不同进化阶段的生物体基因组序列的比较,发现基因组结构组成和功能调节的规律,并利用各种模式生物体的基因剔除和转基因来揭示基因的功能。为此,需要发展能够在基因组整体水平获取功能信息的大规模的功能分析技术,以及对数据进行储存、分析、加工和传输的生物信息学。功能基因组学研究可能将延续整个21世纪,成为医学和生物技术、制药工业知识和技术创新的源泉。

(三)比较基因组学

比较基因组学是指在基因组的层次上,比较不同基因组之间的异同。一般来说,比较基因组学有2个内容。

1.不同物种基因组的比较 通过比较不同物种的基因组,不仅可探索所有生物的基因组进化的连续性、变异性、生物之间亲缘关系的远近、进化过程中基因组“板块”的漂移与组合、基因的分布、基因结构的演化,而且可了解生化代谢途径、生理功能的同一性与特殊性,从而为认识物种的进化、基因功能的演化、基因的调控、疾病和衰老等生命现象的本质提供依据。

2.人类不同基因组的比较 不同的人种、不同的族群、不同的群体以及不同的个体,在其遗传性状上,特别是对疾病与病原体的易患性的不同,提示对人类不同基因组研究的重要性。对人类基因组多样性的研究,以至于将来可能每人具有自己的“基因组图”,对于人类的健康、疾病的诊断、预防、治疗都是很重要的。到那时,医学将成为名副其实的“基因医学”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈