预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110556161A(43)申请公布日2019.12.10(21)申请号201910743293.5(22)申请日2019.08.13(71)申请人浙江工业大学地址310014浙江省杭州市下城区朝晖六区潮王路18号(72)发明人张贵军赵凯龙饶亮夏瑜豪刘俊彭春翔周晓根(74)专利代理机构杭州斯可睿专利事务所有限公司33241代理人王利强(51)Int.Cl.G16B30/00(2019.01)G06N3/12(2006.01)权利要求书2页说明书5页附图1页(54)发明名称一种基于构象多样性采样的蛋白质结构预测方法(57)摘要一种基于构象多样性采样的蛋白质结构预测方法,采用遗传算法与局部搜索策略相结合的方法预测蛋白质结构,在Rosetta第三、四阶段则采用能量函数和本发明的多样性计算方法相结合对种群构象进行采样。优先采样出了只有局部结构差别较大的构象,提高了预测效率和精度,在一定程度上避免了盲目采样。本发明提供一种预测精度较高的基于构象多样性采样的蛋白质结构预测方法。CN110556161ACN110556161A权利要求书1/2页1.一种基于构象多样性采样的蛋白质个体空间优化方法,其特征在于,所述方法包括以下步骤:1)输入预测蛋白质的序列信息,读取序列长度L;设置参数:种群N,迭代次数G,交叉概率Pc;2)根据目标蛋白序列信息,利用Robetta构建片段库,利用PSIPRED预测目标序列的二级结构信息;3)迭代Rosetta第一、二阶段,生成具有N个个体的初始种群4)设g=0,其中g∈{1,2,...,G};5)若g=0,对种群中的个体进行片段组装,生成新的种群P={P1,P2,...,PN};6)基于Rosetta协议第三、四阶段,分别执行步骤7)至步骤11);7)对种群中的个体随机两两配对,形成N/2个父本对;8)交叉操作,过程如下:*8.1)设P1、为两个父本个体,随机选择一段loop区域;*8.2)产生一个随机小数r1,r1∈[0,1],若r1<Pc,交换P1、中选定loop区域的所有残基二面角,生成两个新的个体P1′、P′2;8.3)迭代步骤8.1)和8.2),直至所有父本对交叉完成,生成新的种群P′={P1′,P′2,...P′N};9)变异操作,过程如下:9.1)对种群P′中的个体Pi′,产生一个随机整数r2,r2∈[0,L-3],从该对应的3残基片段库中随机选择一个片段进行替换;9.2)迭代步骤9.1),直至所有个体完成变异,生成新的种群P″={P1″,P″2,...P″N};10)选择操作,过程如下:10.1)产生一个随机小数rb,rb∈[0,1],若rb<0.5,用能量函数对父代种群P和子代种群P″中的个体进行打分,将个体按能量由低到高排序,选出能量低的前N条个体作为下一代种群;否则,执行步骤10.2);10.2)按如下公式计算父代种群P和子代种群P″中所有个体的多样性:diversity(Ci)=max{RMSDdif(Ci,Cj)|Cj∈{P∪P″},Ci≠Cj}其中RMSE′ato表示个体Ci和个体Cj氨基酸序列为0~L/2对应结构的相似性,RMSE″ato表示个体Ci和个体Cj氨基酸序列为L/2~L对应结构的相似性;C′i和C′j表示个体Ci和个体Cj氨基酸序列为0~L/2对应的结构;C′i和C′j表示个体Ci和个体Cj氨基酸序列为0~L/2对应的结构;2CN110556161A权利要求书2/2页和分别表示C′i和C′j中第i个原子的三维坐标,L为结构的序列长度,最后将个体按照多样性大小由高到低排序,选出多样性最大的前N条个体作为下一代种群;11)g=g+1,若g≤Gmax,转至步骤7),否则结束循环;输出预测结果。3CN110556161A说明书1/5页一种基于构象多样性采样的蛋白质结构预测方法技术领域[0001]本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于构象多样性采样的蛋白质结构预测方法。背景技术[0002]蛋白质结构预测问题也称为蛋白质折叠问题。蛋白质折叠结构的形状在很大程度上决定了其生物功能,掌握蛋白质的结构信息对于研究蛋白质的功能具有重要的意义。蛋白质三维结构预测已成为生物信息学重要的研究问题之一。[0003]从头蛋白质结构预测方法是一种常用的蛋白质结构预测方法,由于它仅利用一级序列信息进行预测,而不依赖于已知蛋白质结构模板,所以该方法也是一种较理想的预测方法。从头蛋白质结构预测的理论依据是一定环境中天然蛋白质的三维结构是整个系统自由能最小的结构。因此,从头蛋白质结构预测有两个关键:一是要有一个合理的势函数,势函数的全局极小点对应于蛋白质的天然结构;二是要有一个高效的构象空间搜索算法,保证在有效的