基于蛋白质一级结构的预测方法

时间：2023-02-14 理论教育版权反馈

【摘要】：从以上的结果我们可以看到蛋白质的折叠速率与其结构有着很强的相关性，而结构可由氨基酸序列预测，所以可从氨基酸序列直接预测蛋白质的折叠速率。2005年Punta和Rost提出了一种先从氨基酸序列预测蛋白质3D结构中残基间的长程接触序的方法［25］来预测蛋白质的折叠速率。从以上对蛋白质折叠的研究进程中可以了解到，蛋白质的折叠速率与蛋白质的各级结构有非常强的相关性，也可以说，蛋白质折叠速率这一参量包含了蛋白质结构的许多信息。

从以上的结果我们可以看到蛋白质的折叠速率与其结构有着很强的相关性，而结构可由氨基酸序列预测，所以可从氨基酸序列直接预测蛋白质的折叠速率。这方面的研究工作已做了很多。Gromiha等认为蛋白质的折叠速率是由残基间的相互作用决定的［22］，而相互作用又受氨基酸的物理、化学、能量以及构象等属性的影响，而且，不同二级结构的蛋白质与不同的氨基酸属性相关。2005年，他们把蛋白质大致分为α类、β类和无规卷曲类，继而提出了一个简单的统计模型，根据蛋白质的氨基酸属性来预测其折叠速率。氨基酸的平均属性Pave的计算公式如下：

式中，Pave是蛋白质的氨基酸平均属性，P（j）是氨基酸序列中第j个残基的属性，N是氨基酸序列的残基数。

对于α类蛋白质，Gromiha的线性回归公式［22］是

ln（kf）＝－33.191αc＋20.195（2-4）

式中，ln（kf）是蛋白质折叠速率的自然对数，αc是α螺旋的C端动力（the power to be at the C-terminal）。

对于β类蛋白质，Gromiha的线性回归公式［22］是

ln（kf）＝－81.48K0＋163.08Pβ＋79.92Rα－134.99ΔASA－13.18 （2-5）

式中，K0是可压缩性，Pβ是β折叠趋势，Rα是在溶剂中的收缩率，ΔASA是溶剂可及表面积。

对于无规卷曲类蛋白质，线性回归公式是

ln（kf）＝－102.60K0－90.33Rα＋131.80ΔASA＋90.82ΔGh D－38.53 （2-6）

式中，ΔGh D是对于变性蛋白质水合作用的吉布斯自由能变化量，其他参量与公式（2-5）相同。

除此之外，基于蛋白质一级序列，2003年Shao等提出了使用螺旋参量（helix parameter，HP）来预测蛋白质的折叠速率［23］，接着，2004年Kuznetsov和Rackovsky提出了氨基酸的物理化学特性作为参量［24］来预测蛋白质的折叠速率。2005年Punta和Rost提出了一种先从氨基酸序列预测蛋白质3D结构中残基间的长程接触序（LRO）的方法［25］来预测蛋白质的折叠速率。2006年Galzitskaya等提出链的长度（L）［26］作为蛋白质折叠速率的预测参量。同年，Huang等也提出了用残基的Ω值［27］做预测参量来预测蛋白质的折叠速率。到2008年，Ouyang和liang提出几何接触数参量（the geometric contact number，na）［28］来根据蛋白质的氨基酸属性预测蛋白质的折叠速率。2009年Chou和Shen［29］基于同样的数据库创建了一个蛋白质折叠速率的预测软件。

蛋白质折叠问题是分子生物学中心法则尚未彻底解决的一个重大生物学问题。理解蛋白质的折叠机制对理解蛋白质的生物功能、理解与错折叠相关疾病的起源等是非常重要的。从以上对蛋白质折叠的研究进程中可以了解到，蛋白质的折叠速率与蛋白质的各级结构有非常强的相关性，也可以说，蛋白质折叠速率这一参量包含了蛋白质结构的许多信息。我们认为它可以作为体现蛋白质结构信息的一个很好参量。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈