首页 理论教育 人类基因组研究信息资源的利用

人类基因组研究信息资源的利用

时间:2022-05-20 理论教育 版权反馈
【摘要】:一般认为,BLAST运行速度快,对蛋白质序列的搜寻更为有效;FASTA运行较慢,对核酸序列更为敏感。因此,通常应先作蛋白质序列的比较,再对比核酸序列。只要条件允许,就应当BLAST和FASTA双管齐下,兼收并用。BLAST结果中的得分是对一种相似性的统计说明。

第5节 人类基因组研究信息资源的利用

在基因组相关研究(包括分子生物学研究、分子遗传学研究、进化理论研究等)中常用的软件大致可分为以下几类:核酸、蛋白质序列的编辑处理;酶切图谱的制作;同源性比对;进化关系分析;核酸阅读框架的识别和翻译;二级结构预测;PCR引物设计;蛋白质等电点的计算;亲(疏)水性的分析;结构功能域的预测;基因分型结果分析;微阵列数据分析;等等。在所有的软件中,应用最多的是同源性比较分析软件BLAST和FASTA。它们的功能相近,都是把用户提交的一个核酸序列或蛋白质序列,拿去同指定的数据库中的全部序列作比较。它们的使用方法也大同小异:可用电子邮件提交序列并指定各种参数;可以在浏览器里填表提交作业;还可以把它们下载到自己的计算机上运行,不过这时要备有所需的数据库。一般认为,BLAST运行速度快,对蛋白质序列的搜寻更为有效;FASTA运行较慢,对核酸序列更为敏感。蛋白质序列的比较,往往可以揭示20亿~30亿年前分道发展的同源关系,而DNA序列的比较只能回溯2亿~5亿年。因此,通常应先作蛋白质序列的比较,再对比核酸序列。只要条件允许,就应当BLAST和FASTA双管齐下,兼收并用。现在最通用的办法是直接在服务器的网页界面上提交(“上载”)序列,可以实时等候结果出来,也可以留下电子邮件地址收取结果。

以下简要介绍BLAST软件。

BLAST是basic local alignment search tool(局部相似性基本查询工具)的缩写,它是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速地与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种相似性的统计说明。BLAST能将一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。BLAST还能发现具有缺口的能比对上的序列。

BLAST是基于Altschul等人在J.Mol.Biol上发表的方法,在序列数据库中对查询序列进行同源性比对工作。从最初的BLAST发展到现在NCBI提供的BLAST2.0,已将有缺口能比对的序列也考虑在内了。BLAST可处理任何数量的序列,包括蛋白序列和核酸序列;也可选择多个数据库,但数据库必须是同一类型的,即要么都是蛋白数据库,要么都是核酸数据库。所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。

BLAST包括以下五个程序。

(1)BLASTP:蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

(2)BLASTX:核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的6条蛋白),再对每一条作一对一的蛋白序列比对。

(3)BLASTN:核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一的核酸序列比对。

(4)TBLASTN:蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。

(5)TBLAST:核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈