首页 百科知识 蛋白质结构数据的获得

蛋白质结构数据的获得

时间:2022-02-11 百科知识 版权反馈
【摘要】:蛋白质结构数据库PDB主要存放原子坐标,属于一次数据库。这3个蛋白质结构二次数据库为蛋白质分子设计、蛋白质模型构建及蛋白质工程等研究提供了很好的信息资源和工具。
蛋白质结构数据的获得_分子医学导论

二、蛋白质结构数据的获得

人类基因组计划是20世纪后半叶生命科学中最重大的事件,但仅仅DNA分子中碱基序列还不足以对复杂的生命现象进行全面的解释,因此需要规模化地测定蛋白质三维结构。美国国立卫生研究院(National Institutes of Health,NIH)资助了蛋白质结构基因组计划;欧洲、德国、以色列、日本和韩国等纷纷开展类似工作,规模化地测定蛋白质的三维结构,建设相应的蛋白质结构数据库。

人类总共有3万~4万个基因,大约10万个蛋白质,有1000~2000种不同的折叠类型,目前PDB数据库中约有3万个蛋白蛋(图18-2,表18-1),近千种折叠类型。

img162

图18-2 PDB数据库中蛋白质结构数据的增长

(截至12-Apr-2005)

表18-1 PDB数据库中各种生物类大分子结构数据的测定情况(截至12-Apr-2005)

img163

蛋白质结构基因组计划的主要科学目标是:①规模化地测定蛋白质的三维结构,包括医学上重要的人体蛋白质、来自重要病原体的蛋白质,以及来自模式生物的蛋白质。②基于序列相似性提供结构模型。③用实验和计算方法提供蛋白质功能信息。

测定蛋白质三维结构首先需要规模化地基因克隆和表达,蛋白质分离、纯化以及性质鉴定技术。蛋白质晶体生长技术和三维结构测定,常用X线晶体衍射和多维核磁共振波谱,也可用电镜三维重构,中子衍射、紫外、红外、CD、拉曼、ESR光谱分析及原子力显微镜等。对实验测定的结构数据需用软件(如X-PLOR、CNS之类的大分子X线晶体衍射,核磁共振NMR的三维结构解析软件)进行解析、处理,最后存入相应的结构数据库。

蛋白质序列数据库有SWISS-PROT、PIR、OWL、NRL3D、TrEMBL等,蛋白质片段数据库有PROSITE、BLOCKS、PRINTS等,三维结构数据库有PDB、NDB、BioMagResBank、CCSD等,与蛋白质结构有关的数据库还有SCOP、CATH、FSSP、3D-ALI、DSSP等。

蛋白质结构数据库PDB主要存放原子坐标,属于一次数据库。早在20世纪80年代就已经出现了从PDB数据库的坐标数据中提取信息的程序,并在此基础上构建了蛋白质二级结构构象参数数据库(definition of secondary structure of proteins,DSSP)。DSSP数据库根据PDB中的原子坐标,计算每个氨基酸残基的二级结构构象参数,包括氢键、主链和侧链二面角、二级结构类型等。20世纪90年代以来,随着PDB数据库数据量的增长,出现了许多蛋白质分类数据库。蛋白质家族数据库(families of structurally similar proteins,FSSP)就是其中的一个。它把PDB数据库中的蛋白质通过序列和结构比对进行分类。与DSSP和FSSP相关的另一个蛋白质结构数据库是同源蛋白数据库(homology derived secondary structure of pro-teins,HSSP)。该数据库不但包括已知三维结构的同源蛋白家族,而且还包括未知结构的蛋白质分子,并将它们按同源家族分类。这3个蛋白质结构二次数据库为蛋白质分子设计、蛋白质模型构建及蛋白质工程等研究提供了很好的信息资源和工具。

除了DSSP、FSSP、HSSP外,还有其他许多不同种类和层次的蛋白质结构二次数据库,如蛋白质结构域分配数据库、蛋白质回环分类数据库等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈