首页 理论教育 纯种还是杂交种

纯种还是杂交种

时间:2022-03-08 理论教育 版权反馈
【摘要】:在斯堪的纳维亚半岛,山地兔的种群由于棕兔的引入和威胁不断向北“败退”。FASTA是生物信息学分析中最常见的序列文本文件格式。由于序列是未曾进行比对的,因此接下来我们必须对这多条序列进行比对分析。相应的序列内部的空位也显著增加了,这些都充分说明了进化分析中多序列比对的功能和必要性。

实验二 纯种还是杂交种——基于序列的系统进化分析

生物信息学的快速发展正悄然改变传统进化研究的方式,过去进化的研究或者是基于化石的证据(物种化石所处的考古学年代),或者是基于形态学的证据(例如我们的样貌等外在特征)。但如今,我们可用个别基因的序列乃至整个基因组的序列来研究和探索生物之间的亲缘关系,而且相比于以前的研究方法,材料获取更加容易,信息也更加丰富和完整。当然缺点是序列信息中包含的噪声和冗余信息更多更复杂,这也为其应用带来了一定的困难。因此,虽然分子系统进化分析并不能完全取代传统方法,但毫无疑问这些方法可以互相印证、互为补充。

棕兔(Lepus europaeus Pallus)广泛分布于欧洲,北到北纬60°,南到亚洲的以色列。棕兔是一种深受大众欢迎的狩猎用动物,其地缘分布不断向东方扩展,通过自然分布和迁徙扩展到西伯利亚中部和远东地区。世界上还有在其自然生活范围之外的许多国家和地区如北美、南美、澳大利亚和新西兰都有进口棕兔的记录。

棕兔在丹麦非常常见,且是丹麦存在的唯一Lepus属动物。自20世纪60年代后,欧洲,特别是丹麦的兔子种群数量下降非常快,其主要原因是与农业集约化相关的栖息地的变化,气候变化的影响以及天敌数量的增加。丹麦棕兔数量的下降从每年捕猎到的棕兔数量的下降就可以反映出来,1960年以前每年超过40万,2004—2005年下降到了67 600。而山地兔(Lepus timidus Linnaeus)的分布范围则包含大部分古北地区(包括欧洲、亚洲北部、阿拉伯北部以及非洲的撒哈拉以北部分),在欧洲主要分布在大不列颠、挪威、瑞典、芬兰、阿尔卑斯山以及东欧的部分地区,而在丹麦是没有山地兔的分布的(图5-19)。19世纪的晚期棕兔被引进到南瑞典作为狩猎动物。在斯堪的纳维亚半岛,山地兔的种群由于棕兔的引入和威胁不断向北“败退”。一般认为,山地兔是通过后冰期的两条不同路线“占领”斯堪的纳维亚半岛的,其中一条路线为南部,另一条则为东北部。

在一次针对385只丹麦野生兔子线粒体DNA的测序研究中,科研人员发现了16只基因型与其他野兔存在明显差异的棕兔,而且序列比较的结果发现其序列与另外一个品种的野兔——雪兔(Lepus timidus)的相似程度更高。本实验的目的就是考察这些丹麦野生棕兔的线粒体基因组中是否携带了山地兔来源的基因(由于两种品系野兔的杂交所致),其可能的来源是哪里。

1.上机实验步骤

(1)将来自欧洲的各种野兔以及丹麦本土野兔的DNA序列放在同一个文件中(丹麦野兔标记为“h#_个体编号”,例如“h2_15”表示第2种基因型,对应的野兔个体数量为15),保存为如图5-20所示的FASTA文件,文件名为hares.fasta。

img124

图5-19 山地兔(左)和棕兔(右)

img125

图5-20 FASTA序列格式文件

FASTA是生物信息学分析中最常见的序列文本文件格式。如图5-20所示,文件的第一行以“>”开始,紧随其后的是序列名称以及序列描述,第二行开始才是序列的主体。

思考题 那么,请问在我们的例子中,包含多少条DNA序列?其中欧罗巴棕兔(Leptis europaeus)有几条?山地兔(Leptis timidus)呢?丹麦野兔呢?

(2)打开MEGA(Molecular Evolutionary Genetics Analysis)程序,这时候屏幕上出现一个小窗口如图5-21所示的界面。

img126

图5-21 MEGA程序主窗口

(3)从菜单栏选择Alignment→Alignment Explorer/Clustal,出现一个选择窗口(图5-22),选择Retrieve sequence from a file并按下OK后,选择前面建立的FASTA文件,打开多序列比对浏览器窗口,这时候所有的序列将出现在窗口内(图5-23)。

img127

图5-22 MEGA程序比对编辑器选择弹出窗口

图5-23的默认设置中,A/T/C/G四种核苷酸分别显示为不同的颜色,这是未曾经过多序列比对的原始序列文件。

思考题 多序列浏览器的第一行存在部分用星号(*)标记的列,根据你的观察,这些列与其他列的差别是什么?

(4)由于序列是未曾进行比对的,因此接下来我们必须对这多条序列进行比对分析。在序列比对浏览窗口菜单栏中选择所有序列(Edit→Select All),然后采用ClustalW程序进行多序列比对(Alignment→Align by ClustalW),采用默认的参数[图5-24,两两序列比对和多序列比对的空位罚分均为15(gap opening)+6.66(gap extension),DNA权重矩阵(weight matrix)采用IUB,碱基转换权重(transition weight)为0.5]。

按下OK后多序列比对开始进行,可以在桌面上看到程序的进度条,首先进行的是序列的两两比对(pairwise alignment),然后是多序列比对(multiple alignment),最后你会看到新的序列比对结果如图5-25所示。

img128

图5-23 MEGA序列比对浏览器窗口

img129

图5-24 多序列比对程序ClustalW参数设置

思考题 对比图5-23与图5-25,你会发现第一行的星号(*)明显增加,这是为什么?相应的序列内部的空位也显著增加了,这些都充分说明了进化分析中多序列比对的功能和必要性。

(5)对多序列比对的结果进行修剪,其做法主要是删除两端的连续空位,注意必须整列删除,而不是只删除空位。

(6)选择Data→Export Alignment→MEGA Format,将最后的多序列比对结果导出到硬盘,保存为.meg文件,在弹出对话框中,判断是否为蛋白编码核酸序列数据(Protein-coding nucleotide sequence data),选择为No(图5-26)。

思考题 多序列比对是序列分子亲缘关系分析的重要步骤,结果可以保存为Clustal格式和MEGA格式,请将多序列比对结果格式另外导出为Clustal格式,并分别用写字板打开,请问两种格式的文件有什么区别?

img130

图5-25 多序列比对结果

img131

图5-26 保存多序列结果为MEGA格式的弹出确认对话框

(7)紧接着弹出的是多序列比对数据的浏览器,如图5-27显示的是另外一种多序列比对的展示方式。第一行给出的是每一列的多数核苷酸(consensus nucleotide),如果采用相同符号的表示方式(Display→Use Identical Symbol),则本列与多数核苷酸相同的用点表示,不同的位点则用实际的核苷酸表示,空位则用?表示。出现在工具栏中的按钮C、V、Pi、S分别表示对保守位点(Conserved sites)、可变位点(Variable sites)、简约信息位点(Parsimonious information sites)和单态位点(singleton sites)进行高亮处理。

思考题 分别按下C/V/Pi/S键,根据你的观察,这四个键的确切含义分别是什么?如果将它们分别看作一个集合,则其中V/Pi/S之间是什么样的逻辑关系?

(8)上面窗口图5-27中,Statistics菜单还可以用来对多序列核苷酸的组成(nucleotide composition)、16对有向(Directional,如AA、AG、GA、AC、CA等)或者10对无向(Undirectional,AG、AC、AT等)核苷酸对的出现频率(Nucleotide Pair Frequencies),可以仅对高亮位点(Use Only Highlighted Sites)进行统计,也可以对所有位点(Use All Selected Sites)进行统计。

img132

图5-27 多序列比对结果的另一种呈现方式

思考题 针对高亮Pi位点,统计其无向核苷酸对的出现频率,并填写在表5-2中,如第一行第一列为AA的出现频率,第一行第二列为AT/TA的出现频率,以此类推。

表5-2 Pi位点无向核苷酸对的出现频率

img133

(9)系统进化分析:在主窗口中选择菜单Phylogeny→Construct Phylogeny创建系统发生树(phylogeny tree),采用邻接法(Neighbor-Joining),弹出邻接法参数设置窗口(图5-28),这里采用默认设置,并按下Compute键,即可得到系统进化树,如图5-29所示。

思考题 根据绘出的进化树,判断哪种丹麦野兔的线粒体DNA中,存在与山地野兔同源的基因?如果存在,说明其可能的来源国是哪个?

至此,本实验就告一段落了。当然,你还可以对建立的进化树采用不同的呈现格式(View菜单),或者对输出的进化树进行修剪(Subtree菜单),或者导出为不同格式的图形文件(Image菜单),同学们可以自行尝试,在这里就不多赘述了。

2.实验小结

实验二结合实例讲解,让同学们基本掌握了利用MEGA软件进行基于DNA序列进行系统进化分析的基本步骤和方法。当然,限于现有的知识,我们无法进行更加深入的分析,但不管如何,通过本实验,同学们对于多序列比对和系统发生树(图5-30)分析方法有了比较直观的认识。

img134

图5-28 邻接法的参数设置窗口

img135

图5-29 邻接法建立的系统发生树图

img136

图5-30 系统发生树的环形图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈