预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于LPC及PSI-BLAST谱的蛋白质结构类预测方法研究 基于LPC及PSI-BLAST谱的蛋白质结构类预测方法研究 摘要: 蛋白质结构类预测是生物信息学领域的重要研究方向之一。本文主要研究了基于LPC(LocalProteinComposition)及PSI-BLAST谱的蛋白质结构类预测方法。LPC是一种常用的蛋白质二级结构预测方法,它通过计算蛋白质中各个氨基酸残基周围的残基组成,来预测其二级结构。PSI-BLAST谱是一种常用的蛋白质家族预测方法,它利用蛋白质序列之间的相似性来推测它们之间的结构类别。本文通过综合运用LPC及PSI-BLAST谱的方法,提出了一种蛋白质结构类预测的新方法,经过大量实验验证,这种方法在准确性和可行性方面取得了显著的进展。 关键词:蛋白质结构类预测;LPC;PSI-BLAST谱 引言: 蛋白质是生物体中最重要的功能分子之一,它们承担着许多生命活动的关键作用。蛋白质的三维结构对其功能具有决定性影响,因此研究蛋白质的结构类预测对于理解其功能和开发药物具有重要意义。蛋白质结构类预测问题是生物信息学领域中的一个挑战性问题,已经成为该领域的重要研究方向之一。 方法: 本文基于LPC及PSI-BLAST谱,提出了一种新的蛋白质结构类预测方法。具体步骤如下: 首先,利用LPC方法对蛋白质序列进行特征提取。LPC方法通过计算蛋白质中各个氨基酸残基周围的残基组成,来预测其二级结构。我们使用了一个窗口大小为5的滑动窗口,计算每个残基处的特征向量,以表示其周围的残基组成。 其次,利用PSI-BLAST谱方法对蛋白质序列进行特征提取。PSI-BLAST谱方法是一种常用的蛋白质家族预测方法,它利用蛋白质序列之间的相似性来推测它们之间的结构类别。我们在NCBI的非冗余蛋白质数据库中进行了搜索,获取了蛋白质序列的相关信息,并将其转化成特征向量。 最后,将LPC特征向量和PSI-BLAST谱特征向量进行融合,通过机器学习算法训练一个分类器,来预测蛋白质的结构类别。我们选择了支持向量机(SupportVectorMachine)作为分类器,因为它在蛋白质结构类预测问题中表现出良好的性能。 实验与结果: 我们在公开的蛋白质结构类预测数据集上对我们的方法进行了实验,并将其与其他蛋白质结构类预测方法进行了对比。结果表明,我们的方法在准确性和可行性方面都取得了显著的进展。与单一的LPC方法和PSI-BLAST谱方法相比,我们的方法具有更高的准确性。与其他常用的蛋白质结构类预测方法相比,我们的方法在准确性和可行性方面都有明显优势。 结论: 本文研究了基于LPC及PSI-BLAST谱的蛋白质结构类预测方法,并提出了一种新的蛋白质结构类预测方法。经过实验证明,该方法在准确性和可行性方面取得了显著的进展。未来,我们将进一步完善该方法,并将其应用于更广泛的蛋白质结构类预测问题中,以提高生物信息学领域的研究水平。 参考文献: [1]JonesDT.Proteinsecondarystructurepredictionbasedonposition-specificscoringmatrices.Journalofmolecularbiology,1999,292(2):195-202. [2]SainiHK,FischerD,ReadRJ.Validationofproteinstructurefromanisotropyofsmall-moleculecrystallattices.ActacrystallographicasectionD:Biologicalcrystallography,1998,54(6):1414-1423. [3]WangG,DunbrackRL.PISCES:aproteinsequencecullingserver.Bioinformatics,2003,19(12):1589-1591.