预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114783512A(43)申请公布日2022.07.22(21)申请号202210247039.8(22)申请日2022.03.14(71)申请人浙江工业大学地址310014浙江省杭州市拱墅区潮王路18号(72)发明人张贵军黄兆鸿夏瑜豪刘栋徐旭瑶周晓根(74)专利代理机构浙江千克知识产权代理有限公司33246专利代理师赵芳(51)Int.Cl.G16B15/20(2019.01)G16B40/00(2019.01)G16B30/10(2019.01)G16B50/30(2019.01)权利要求书1页说明书5页附图2页(54)发明名称一种基于动量辅助构象空间采样的蛋白质结构预测方法(57)摘要一种基于动量辅助构象空间采样的蛋白质结构预测方法,通过构建动量不仅去除了能量陡峭点,还使构象采样过程更容易跳出局部最低点;将动量叠加到原有的能量函数,使得原本比较尖锐的能量函数变得平滑;并且由于动量保留了之前采样的信息,使得越是陡峭的能量低点越容易跳出,同时设计了一个自适应方法,在采样的开始动量更新的权重占比更大,随着采样次数的增加,减少动量更新的权重。本发明提供一种极大地提高了采样效率和采样能力、提高预测精度的基于动量辅助构象空间采样的蛋白质结构预测方法。CN114783512ACN114783512A权利要求书1/1页1.一种基于动量辅助构象空间采样的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)输入目标蛋白质的序列信息;2)根据输入目标蛋白质的序列信息从Robetta服务器获取片段库文件,其中包括3片段库文件和9片段库文件;3)设置参数:最大迭代次数G,初始动量M,衰减函数系数k,模拟退火算法初始温度T,动量能量项系数μ;4)设置迭代次数g=1,g∈{1,2,...,G};5)构象生成:利用Rosetta协议,生成初始构象,记为6)对初始构象使用能量函数叠加动量的方法,过程如下:6.1)设置能量函数Eg(P)=score3(P),score3(P)为Rosetta协议中的能量函数,记为能量最低的接收构象,为当前构象的前一次被接收构象,初始化记为被接收构象的能量函数,为上一次被接收构象的能量函数;6.2)记分别为能量最低的接收构象的第i个残基的二面角,分别为前一次被接收构象的第i个残基的二面角,L为目标蛋白的序列长度,d为两个构象直接的相似度,Mnew为当前动量,β为动量更新的参数,按如下公式计算动量M:M=βM+(1‑β)Mnew(3)gg6.3)记P为当前构象,Eg(P)为当前构象的能量,μ为动量作用到能量项的参数,按以下公式计算:7)设置g=g+1,若g>G,则执行步骤8);否则转至步骤6);8)输出G次迭代中G个能量最低构象作为最后预测结果,g∈{1,2,...,G}。2CN114783512A说明书1/5页一种基于动量辅助构象空间采样的蛋白质结构预测方法技术领域[0001]本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于动量辅助构象空间采样的蛋白质结构预测方法。背景技术[0002]蛋白质是生命的物质基础,了解它们的三维结构有助于从机制上理解它们的功能,如推理生物过程、实现基于结构的药物开发和靶标蛋白诱变等。因此几十年来得到蛋白质三维结构一直是生物学的一大挑战。[0003]目前,测定蛋白质的三维结构主要有两大类方法:一类是生物湿实验的方法;另一类就是根据计算机技术根据蛋白质的氨基酸序列预测其三维结构的方法。生物湿实验一般是指核磁共振、X射线晶体衍射技术和冷冻电镜这些方法,尽管通过这些方法得到的蛋白质三维结构的精度非常高,但是也存在很大的缺点,如一个结构的预测周期较长、成本较高、难度大。而根据计算机技术预测蛋白质结构的方法可以高效,快速简便地获得蛋白质三维结构。并且蛋白质结构的计算方法的发展主要基于物理相互作用,现有的方法主要是使用传统的理化知识、结合机器学习预测残基间的距离和取向等,构建能量函数,利用策略在构象空间中搜索全局最优解。[0004]但是,传统的蛋白质结构预测方法由于分子模拟的计算难度和蛋白质稳定性等方面的影响,现有的方法普遍存在三大缺陷:第一,极易陷入局部能量低点,虽然有概率跳出局部能量低点,导致采样不足;第二,传统的方法每次采样过程相互独立,彼此不能获取信息,而构象空间是非常庞大的,导致每次运行后容易反复进入局部能量低点,导致采样效率低;第三,目前的优化算法在遇到比较陡峭的能量低点时很难跨越,而这种能量低点并不一定是全局最优解,导致预测精度不高。[0005]因此,现有的蛋白质结构预测方法存在采样不足、采样效率低下和预测精度不高等问题,需要改进。发明内容[0006]为了克服现有的蛋白质结构预测方法的采样效率低下、采样不足和预测精度