首页 理论教育 蛋白质预测结构方法哪种更准确

蛋白质预测结构方法哪种更准确

时间:2022-02-14 理论教育 版权反馈
【摘要】:结果表明,对于单个参量,只有D2与蛋白质折叠速率具有显著相关性,而对于参量对,与蛋白质折叠速率有普遍的显著相关性。结果证实了我们的想法,对于不同类蛋白质,其mRNA序列对折叠速率有不同的影响。对于多态蛋白质,与蛋白质折叠速率显著相关的是mRNA序列的GC含量。这一结果又一次证明了同义密码子的使用对蛋白质折叠速率的影响。

1)各参量与参量组合对整个蛋白质组折叠速率的影响

本节基于77个蛋白质,做了蛋白质折叠速率与各参量间的线性回归分析,同时也做了蛋白质折叠速率与各参量组合间(如D1和D2;D1和X;D2和X;X和CGC)的线性回归分析,结果列在表3-10中。

表3-10 77个蛋白质各参量与折叠速率回归分析结果

注:r是相关系数,p是相关水平。

结果表明,对于单个参量,只有D2与蛋白质折叠速率具有显著相关性,而对于参量对,与蛋白质折叠速率有普遍的显著相关性。我们注意到与蛋白质折叠速率相关系数最大的两组参数对为D1和D2;D2和X,它们的相关系数均达到0.53。

2)各参量与参量组合对不同类蛋白质折叠速率的影响

考虑到上述参量可能对二态和多态蛋白质有不同的影响,我们分别基于42个二态蛋白质与35个多态蛋白质做了折叠速率与各参量与参量组间的回归分析。同时考虑到蛋白质相应的mRNA序列对不同二级结构类的蛋白质可能有不同的影响,所以分别基于16个全α蛋白质,31个全β蛋白质和30个混合蛋白质也做了同样的线性回归分析。相关结果列在表3-11和表3-12中(只列出具有普遍相关性的结果)。

表3-11 D2和X对蛋白质折叠速率的影响

注:表中的数值为相关系数;用p表示相关水平,则“*”表示p≤0.05;“**”表示p≤0.01。

表3-12 各类蛋白质相应的mRNA序列GC含量与蛋白质折叠速率回归分析结果

注:表中的数值为相关系数;用p表示相关水平,则“**”表示p≤0.01。

结果证实了我们的想法,对于不同类蛋白质,其mRNA序列对折叠速率有不同的影响。在诸多结果中我们发现,对于二态蛋白质,D2和X这一参量组与全α蛋白质以及全β蛋白质折叠速率均有极显著的相关性,尤其对于二态蛋白质,相关系数达到0.84。而对于多态蛋白质,蛋白质mRNA序列的GC含量对蛋白质折叠速率的影响较为突出。

3)mRNA序列GC含量的影响

对于多态蛋白质,与蛋白质折叠速率显著相关的是mRNA序列的GC含量。为了进一步分析GC含量的影响,我们计算了各mRNA序列密码子每一位点的GC含量,分别命名为C1GC,C2GC和C3GC,然后对二态和多态蛋白质,分别做了C1GC, C2GC和C3GC与蛋白质折叠速率的线性相关分析,结果如表3-13所示。

表3-13 二态与多态蛋白质中密码子各位点GC含量与蛋白质折叠速率回归分析结果

注:表中的数值为相关系数;用p表示相关水平,则“*”表示p≤0.05;“**”表示p≤0.01。

我们发现很有趣的结果是:对于二态蛋白质,GC含量的影响来自密码子的第二位点,而对于多态蛋白质,GC含量的影响则来自密码子的第一和第三位点。我们感兴趣的是密码子第三位点的影响。因为第三位点的GC含量正是反映了同义密码子使用的偏执。这一结果又一次证明了同义密码子的使用对蛋白质折叠速率的影响。

总之,本章选取了蛋白质编码序列的四个代表遗传语言的参量,直接验证了这些参量对蛋白质折叠速率的影响。结果发现它们与蛋白质折叠速率的一些相关性。特别值得提出的是,首先对于二态蛋白质,参量对D2和X与全α蛋白质以及全β蛋白质折叠速率均有极显著的相关性,尤其对于全α蛋白质,它们的相关系数达到0.84。这一相关性可以和目前基于蛋白质一级序列的最佳结果比拟,2008年Ouyang和Liang基于同样的数据得到的相关系数为0.86,2009年Chou和Shen得到的相关系数为0.88。虽然没有达到最大值,但是我们的结果是基于蛋白质的mRNA序列,是一项开创性研究,如果能更好完善参量的选择,有望提出基于蛋白质mRNA序列预测蛋白质折叠速率的方法。从这种意义上讲,我们这一结果是令人鼓舞的。另外,对于多态蛋白质,相应mRNA序列的GC含量与其折叠速率有很好的相关性,进一步研究发现这种影响其中一部分来自密码子的第三位点,又一次证实了同义密码子的使用偏性对蛋白质折叠速率的影响。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈