预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109300505A(43)申请公布日2019.02.01(21)申请号201810993749.9(22)申请日2018.08.29(71)申请人浙江工业大学地址310014浙江省杭州市下城区朝晖六区潮王路18号(72)发明人张贵军王小奇郝小虎周晓根马来发胡俊(74)专利代理机构杭州斯可睿专利事务所有限公司33241代理人王利强(51)Int.Cl.G16B15/20(2019.01)G16B40/00(2019.01)权利要求书2页说明书7页附图2页(54)发明名称一种基于有偏采样的蛋白质结构预测方法(57)摘要一种基于有偏采样的蛋白质结构预测方法,在遗传算法的基本框架下,对每个目标个体进行基于二级结构的有偏交叉策略;然后,随机选择一个变异窗口,以每个片段的二级结构得分为适应值,利用轮盘赌的方式选择一个适应值较高的片段来替换构象中的片段信息;最后,以构象的结构属性为主,能量属性为辅共同来指导种群的更新,进而选出潜在的构象进入下一代种群。本发明提出一种预测精度高、计算代价低的基于有偏采样的蛋白质结构预测方法。CN109300505ACN109300505A权利要求书1/2页1.一种基于有偏采样的蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:1)给定输入序列信息;2)利用PSIPRED平台预测目标蛋白的二级结构信息,利用ROSETTA平台构建9片段的片段库;3)选取Rosettascore3能量函数E(x);4)参数初始化:设置种群规模Ps,迭代计数器g,最大遗传代数Gmax,初始种群搜索轨迹长度N,交叉片段长度c;5)初始化种群:启动Ps条MonteCarlo轨迹,每条轨迹搜索N次,即生成Ps个初始个体;6)对每个目标个体xi,i∈{i=1,.2..,Ps}进行如下操作:6.1)随机选择一个个体xj,j∈{1,2,...,Ps}且j≠i,进行交叉操作:6.1.1)产生一个随机整数r∈[1,l-c],确定出交叉区域[r,c+r],其中l为序列长度;6.1.2)根据预测的二级结构知识,确定出目标蛋白在区域[r,c+r]中对应的二级结构Src={qk|r≤k≤r+c},其中,qk∈{H,E,L}是在目标蛋白中预测的第k氨基酸对应的二级结构类型;6.1.3)利用DSSP测定个体xi的二级结构,并确定出交叉区域对应的二级结构序列其中,是构象xi中第k个残基对应的二级结构类型;6.1.4)根据公式计算个体xi中交叉片段的得分,其中,f(k)根据如下公式计算:其中,pk代表在预测的二级结构知识中第k个氨基酸的二级结构被预测为qk的置信度;6.1.5)与步骤6.1.3)同理,确定出个体xj中区域[r,c+r]对应的二级结构序列6.1.6)与步骤6.1.4)同理,计算个体xj中交叉片段的二级结构得分6.1.7)比较与的大小,如果则xi′=xi,并进入步骤6.2),否则,执行步骤6.1.8);6.1.8)用个体xj中[r,c+r]区域的扭转角度依次替换个体xi中对应区域的扭转角,生成交叉个体xi′;6.2)对个体x′i进行如下的变异操作:6.2.1)随机产生一个整数u∈[1,l-9],进而确定出个体x′i的片段插入窗口[u,9+u]以及片段库中对应的片段其中h是片段库中对每一个片段的编号;6.2.2)根据片段库中的信息确定出在第u个位置处,每个片段的二级结构其中,是片段库中第h个片段的第t个氨基酸对应的二级结构类型;6.2.3)与步骤6.1.4)同理计算得到在第u个位置处,片段库中每个片段的二级结构得分2CN109300505A权利要求书2/2页6.2.4)根据公式计算在第u个位置处每个片段的适应值;6.2.5)以为每个片段的适应值,利用轮盘赌的方式随机选取一个片段,并用该片段的扭转角替换个体x′i中的扭转角,生成变异分体x″i;6.3)根据能量和二级结构得分进行如下的选择操作:6.3.1)利用DSSP分别测定出个体xi和x″i的二级结构序列和6.3.2)与步骤6.1.4)同理,分别计算个体xi和x″i的二级结构得分ssi和ss″i;6.3.3)比较ssi和ss″i的大小,如果ssi<ss″i,则变异个体x″i换个体xi,并作为下一代的目标个体,执行步骤7),否则执行步骤6.3.4)和步骤6.3.5);6.3.4)根据Rosettascore3函数分别计算个体xi和x″i的能量E(xi)和E(x″i);6.3.5)比较E(xi)和E(x″i)的大小,如果E(x″i)<E(xi),则变异个体x″i换个体xi,并作为下一代的目标个体,执行步骤7),否则个体xi被保留,并作为下一代的目标个体,执行步骤7);7)对种群中的每一个个体都执行完步骤6)以后,迭代次数g=g