首页 百科知识 人类基因组中的转座因子

人类基因组中的转座因子

时间:2022-09-29 百科知识 版权反馈
【摘要】:Alu序列长约300 bp,它是人类基因组中重复程度最高的一类重复序列,约有50万份,相当于人类基因组的10%左右。综合上述结果,罗伯荪等认为人类基因组中的“Alu-功能基因序列-Alu”结构是类似转座子的。显而易见,转座因子在人类基因组中的分布非常广泛,几乎深入到每一个结构基因内部。

自从在玉米、果蝇、酵母和多种原核生物中发现了转移因子以后,人们最关心的是人类基因组中是不是也存在着这种转移性遗传因子。许多研究中心和实验室都曾经探索过这个问题。这里简单介绍一下美国休斯敦得克萨斯大学的罗伯荪(D.L.Robberson)等早期有代表性的研究工作。罗伯荪等以人类基因组中的Alu序列为研究目标,Alu是施密德(C.Schmid)等在1979年分离到的重复序列家族,因具有Alu Ⅰ的切割序列而得名。Alu序列长约300 bp,它是人类基因组中重复程度最高的一类重复序列,约有50万份,相当于人类基因组的10%左右。已知的人功能基因的基本结构往往是一个单拷贝序列夹在两个重复序列中间,而多数都是夹在两个Alu重复序列中间。如果将人的基因组DNA变性后复性,再用切除单链的核酸酶S1处理,就可得到大量300 bp的DNA片段。这个片段经过限制性内切酶Alu Ⅰ处理后就分为170 bp和120 bp两段。罗伯荪等曾经认为Alu所起的作用和LTR在转移因子中的作用很可能是相似的。此外,许多实验表明Alu序列和DNA的复制和核内RNA加工过程有关联。

为了验证这个假设,罗伯荪等利用克隆于噬菌体λ的两段含Alu序列的人DNA片段pλH15A和pλH15B(图7-22)作为探针来研究人类基因组中Alu序列的结构、分布和可能的功能。

图7-22  pλHA15和pλHA15结构示意(引自B.Calabretta)

A、B是单拷贝的功能基因。

图中“Alu-功能基因-Alu”这样的结构是符合转移因子结构通式的。有了携有功能基因A或B的探针,就有可能探测出基因组中包括的“Alu-A lu”或“Alu-B lu”结构的数量和位置,并可由此推断这样的结构是不是一个类似转移因子的结构。这里要重点介绍以pλH15A为探针所做研究的几个结果。

(1)在正常细胞和肿瘤细胞的基因组DNA中,与pλH15A同源的DNA片段的长度不同,相同长度的片段,拷贝数也不尽相同。

(2)源自肝、肺、心、脾、小肠、脑和肾等脏器的细胞中,与pλH15A同源的DNA片段的长短不一,同一长度的片段,拷贝数也不相同。

(3)取自淋巴细胞白血病、肝癌、骨髓癌等肿瘤的癌细胞中,与pλH15A同源的DNA片段的长度和拷贝数均不相同。

(4)用限制性内切酶Eco R Ⅰ、Bam H Ⅰ、Hin dⅢ和BglⅡ切割后,所得到的与pλH15A同源的片段中的共同主段长度均为4.8 kb。这暗示这段DNA很可能是一个环状DNA分子,环上有上述各种酶的一个切点,电镜观察也支持这种看法。

(5)用含Alu序列的探针探明每个环状DNA分子都有Alu重复序列。

综合上述结果,罗伯荪等认为人类基因组中的“Alu-功能基因序列-Alu”结构是类似转座子的。它在不同的组织细胞与不同的发育阶段都有各不相同的插入部位和数目不等的扩增拷贝数,还可能和肿瘤的发生密切相关。这种以Alu重复序列为“遗传学按扣”的转移性遗传因子式结构,大大增加了人类基因组的能动性

从麦克林托克在玉米中发现转座因子到对原核生物中转座子的深入研究,为系统研究高等植物、动物和人类基因组中转座因子的结构与功能、转座的机制,及其如何影响寄主基因的结构与表达等问题奠定了基础。

近年来的基因组测序计划表明来源于各类转座因子的DNA在人类基因组中约占45%,且有多种结构特征,而编码基因序列仅占1.5%(图7-23a)。根据转座移动方式可以将这些转座子分为逆转座子(图7-23b)和DNA转座子(图7-23c)。逆转座子包括短散布重复元件(short interspersed nuclear element,SINE)如Alu、长散布重复元件(long interspersed nuclear element,LINE)如L1和人类内源性逆病毒(human endogenous retroviruses,HERV)。DNA转座子如图7-23c所示的MARINER。其中HERV和LINE具有编码转座所需的基因,所以是自主型逆转座子,而Alu和SVA(short interspersed element/variable number of tandem repeat/Alu)因没有这些基因被列为非自主型逆转座子。

图7-23  (a)人类基因组中的几类主要的转座因子所占比例;(b)、(c)各类转座子的基本结构示意(改自R.Cordaux和Y-J.Kim等)

Alu由左右两个单聚体组成,中间是一段富含腺嘌呤的序列,左侧单聚体带有内在的RNA多聚酶Ⅲ启动子(图中的A框和B框)。L1全长约6 kb,具有编码RNA结合蛋白、内切酶和逆转录酶基因的开读框架(ORF),两侧带有非翻译区(UTR)。ORF1和ORF2之间是一段约60 bp的基因间隔区(intergenic spacer,IS)。VSA有一段(CCCTCT)n六聚体,还有Alu样(Alu-like)序列和数目可变的重复序列(VNTR),以及短的散布因子R(short interspersed element-R,SINE-R),图中还在Alu样序列上方用箭头显示出Alu序列的方向。HERV具有编码用于病毒感染的属特异性抗原的基因gag、编码蛋白酶的基因prt、编码多聚酶的基因pol和编码外壳蛋白的基因env,两侧装有长末端重复序列。DNA转座子MARINER具有能编码带有DNA结合结构域和催化结构域的转座酶的基因,两侧装着反向重复序列IR。所有的转座因子的两侧都携带在整合过程中装上的插入靶位复制序列(target site duplication,TSD)。

研究数据表明,人类基因组中的自主型无LTR逆转座子(如LINE)长度为1~5 kb,拷贝数为20 00~40 000,占基因组的21%;非自主型无LTR逆转座子(如SINE)长度为100~300 bp,拷贝数为1 500 000,占基因组的13%;DNA转座子也分自主型和非自主型,自主型DNA转座子长度为2~5 kb,非自主型DNA转座子长度为80~3 000 bp,两者合计拷贝数约为300 000,占基因组的3%。显而易见,转座因子在人类基因组中的分布非常广泛,几乎深入到每一个结构基因内部。我们可以用一个生动而形象的实例来说明。尿黑酸-1,2-双加氧酶(homogentisate 1,2-dioxygenase,HGO)是一个典型的疾病相关基因,它的缺陷可导致尿黑酸尿症。图7-24显示了人类HGO基因中的重复序列,值得注意的是分布在基因区的转座子都位于内含子中,所以转座子序列在原始转录产物中的剪接过程中都会和内含子序列一起被切除。这种安排可能是生物演化的结果,最初插入外显子的转座子序列很可能在生物演化过程中被“负选择”掉。

图7-24 人HGO基因中重复序列的种类及其分布示意(仿自B.Granadino等)

图中上部显示了HGO基因外显子位置,下部显示了重复序列Alu(蓝色)、SINE(紫色)和LINE(绿色)的位置。

转座因子在基因组中的转座方式主要分两种。DNA转座子采用切割-粘贴(cut-and-paste mechanism)转座模式。转座子先利用自身编码的转座酶识别转座子两侧特异性序列,接着与靶DNA结合形成转座小体,最后转座酶切割供体DNA和靶DNA,并将转座子整合至靶位完成转座(图7-25)。整个转座过程并不涉及转座子的复制,所以DNA转座子在寄主基因组中的拷贝数不会大幅度扩增。需要注意的是,DNA转座子的准确切离(precise excision)是转座子原先所在基因恢复功能的先决条件。

逆转座子的转座不以切割原转座子为前提,而是以其RNA转录产物为介导,经过逆转录为DNA拷贝,再转座至新的靶位。因为单个逆转座子可以转录出许多RNA,又可逆转录出多个DNA拷贝扩散至寄主基因组,插入后的转座子又是稳定而持续的,不易再被切除,因此在转座过程中会增加其在基因组中的拷贝数。这种转座方式又称为复制-粘贴(copy-and-paste mechanism)转座模式。显然逆转座子的转座机制是导致它们在寄主基因组中数量极多的重要原因。图7-26显示了两种转座模式的主要差别。

图7-25 DNA转座子的“切割-粘贴”转座模式示意(改自A.Changela等)

差不多10年前遗传学家会通过对转座因子插入特定基因来研究转座因子对基因表达调控的影响,现在已经有可能分析转座因子对整个基因组调控的作用。研究发现转座因子含有多种调节序列,如启动子、增强子、多聚A信号序列、隐蔽的剪接供体和剪接受体序列等,这些调节元件都可能改变邻接基因转录产物的构型。

图7-27是转座因子插入方式或位置不同造成的寄主基因组结构变异和基因表达异常示意图。一般转座子通过对寄主基因组内插入靶点的特定序列5′-TTAAA-3′的识别实现典型的转座因子插入(图7-27a),有时也有可能发生转座因子的非典型插入(图7-27b);两个转座因子之间如发生非同源端部融合(non homologous end joining,NHEJ)则会造成涉及几个碱基对的微型缺失(图7-27c);转座因子也可能造成染色体内部或染色体之间的非等位基因间同源重组(nonallelic homologous recombination,NAHR),致使相关染色体产生缺失(图7-27d);此外,由于插入寄主基因组的位置不同,转座子插入后组合成的序列可转录出不一样的转录产物,经剪接后或可形成开读框架正常的mRNA,也可能产生多种异常结构,导致寄主基因表达受阻(图7-27e)。

图7-27 转座因子插入方式或位置不同造成的寄主基因组结构变异和基因表达异常示意(改自Y.J.Kim)

灰色和粉红色三角形代表插入靶位重复序列;黑色线条代表转座子不同的剪接方式;灰色线条表达间隔区域;椭圆形圈内是同源重组区域;粉红色框是微小同源序列区。

在了解人类基因组中转座因子的结构以后,我们最关心的是几乎占了整个基因组一半的转座子或转座子样结构究竟有什么功能?它们的结构或功能异常又会造成什么样的后果?会不会影响健康,甚至导致疾病?

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈