首页 百科知识 基因的复合性

基因的复合性

时间:2022-09-29 百科知识 版权反馈
【摘要】:大量证据表明基因并不一定是单一的,而可以是由多个结构相似的基因组成的复合结构,称为基因家族。基因家族包括在不同发育阶段表达的基因,也包括一些不能编码功能性蛋白的“假基因”。仍以小鼠β类珠蛋白为例,虽然从表型推断应有4个基因,但分子遗传学研究表明,至少存在9个β类珠蛋白基因。另外,假基因还是真核基因组在生物演化中产生新的功能基因的重要原材料。

遗传学中还有一种传统的看法,认为基因是简单的,是单一的,一个基因就是一种遗传性状在基因组中的直接代表。譬如,小鼠有四种β类珠蛋白,两种是胚胎型的,两种是成年型的,因此有人就认为小鼠“理应”有四个β类珠蛋白基因。这个观点看来也是不符合实际的。大量证据表明基因并不一定是单一的,而可以是由多个结构相似的基因组成的复合结构,称为基因家族。基因家族包括在不同发育阶段表达的基因,也包括一些不能编码功能性蛋白的“假基因”。仍以小鼠β类珠蛋白为例,虽然从表型推断应有4个基因,但分子遗传学研究表明,至少存在9个β类珠蛋白基因。除两个成年型β类珠蛋白基因,即β类珠蛋白主基因和β类珠蛋白次基因外,还有βhl、βh0、εy3、βh3、βh2。其中βh3和βh2可能是假基因(pseudogene),它们的启动子序列、多聚腺嘌、呤终止序列、加工切拼信号序列等部位发生了碱基变换、缺失或插入突变,使这两个β类基因不再编码β类珠蛋白。另外还有两个β类基因εy2和εz是编码胚胎型β珠蛋白的。人的β类珠蛋白也是一个多个基因复合而成的基因簇,一系列β珠蛋白基因在染色体11p55区域按发育过程中的表达次序排列,并受控于5′上游的一个基因座调控区(locus control region,LCR)调节。排在最靠近调控区的是在胚胎发育中最先表达的ε,接着是主要在胚胎期表达的Gr和Ar,这两个基因编码的珠蛋白结构和功能都十分相似,只是Gγ的第136位氨基酸是甘氨酸,而Aγ的第136位氨基酸是丙氨酸,Gγ和Aγ后面是假基因ψβ,接下来是在胚胎发育后期表达的δ基因,最后是主要在出生后表达的β基因。这个例子可以清楚地看出,即使是所谓的“单拷贝基因”也不一定是单一的,哺乳动物基因组的结构远比从表型推测的要复杂得多,并在生物演化过程中逐渐形成与基因在个体发育中的表达顺序有关联的染色体亚结构(图9-4)。

基因家族和假基因的发现提出了一个全新的问题:类似ψβ这样的假基因是怎样形成的?它有什么作用?连锁分析表明基因家族的成员往往是成簇排列的,结构同源的基因或假基因在同一染色体上呈“串联”式排列,还往往共享同一个基因座调控区。由此可以假定,不等交换很可能是假基因起源的一种主要形式。然而,冗余重复的基因对机体可能是有害的,例如,过多的β类珠蛋白会造成α类和β类珠蛋白在形成血红蛋白分子时数量上的不平衡,以致产生红细胞的病理效应。这时冗余基因的缺陷突变在选择上有明显的优势,于是随着突变和选择的交替作用,导致一种不能编码β珠蛋白的假基因。必须强调的是假基因并不一定是永远不表达功能的,它既可能是某种分化细胞的功能基因,也可能影响和调节邻接基因的功能表达。另外,假基因还是真核基因组在生物演化中产生新的功能基因的重要原材料。

图9-4 小鼠和人的β珠蛋白基因簇连锁关系示意

(a)小鼠β珠蛋白基因簇(未显示εy2和ε Z);(b)人的β珠蛋白基因簇

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈