预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于LPC及PSI-BLAST谱的蛋白质结构类预测方法研究的中期报告 该研究旨在开发一种基于LPC(LocalProteinCoordinat)和PSI-BLAST谱的蛋白质结构类预测方法。在本次中期报告中,我们进行了以下工作: 1.数据集的准备 我们选取了PDB中的250个结构类似但序列相似度较低的蛋白质作为数据集,并根据已有的实验数据将其分为4个结构类别:α螺旋,β片层,α+β型和不规则结构。在预测中,我们将把每个蛋白质分为这四类中的一类。 2.特征提取 我们采用LPC作为蛋白质结构的特征提取方法,通过计算所有原子间的距离,得到每个氨基酸残基的LPC向量表示。同时,我们还使用了PSI-BLAST谱来获取蛋白质序列的进化信息,并将其作为特征之一。 3.模型训练 我们使用了多层感知机(MLP)作为结构类预测的模型,并利用我们准备好的数据集进行了模型的训练。在模型中,我们使用了交叉熵作为损失函数,并使用了随机梯度下降法来进行参数优化。 4.中期结果 在250个测试样本中,我们的模型在结构类预测上的准确率达到了70%左右。其中,对于α螺旋、β片层和α+β型结构的预测准确率均超过了70%,而对于不规则结构的准确率略低于60%。 5.下一步工作 我们将继续尝试改进模型的性能,例如尝试使用其他的特征提取方法或模型优化算法。同时,我们也将扩大数据集的规模并尝试进行更多的实验验证。