预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115035947A(43)申请公布日2022.09.09(21)申请号202210656929.4(22)申请日2022.06.10(71)申请人水木未来(北京)科技有限公司地址100089北京市海淀区西郊北洼路1区195幢3层102(72)发明人李盼郭春龙(74)专利代理机构北京林达刘知识产权代理事务所(普通合伙)11277专利代理师刘新宇(51)Int.Cl.G16B5/00(2019.01)权利要求书2页说明书15页附图5页(54)发明名称蛋白质结构建模方法及装置、电子设备和存储介质(57)摘要本公开涉及一种蛋白质结构建模方法及装置、电子设备和存储介质。所述方法包括:对蛋白质序列进行结构预测,获得第一蛋白质结构信息,以及蛋白质序列的Ca原子对距离误差;根据Ca原子对距离误差,确定结构域;根据电子云密度图,获得蛋白质序列片段;根据电子云密度图和蛋白质序列片段,对结构域进行筛选,获得目标结构域;根据目标结构域和电子云密度图,获得蛋白质结构模型。根据本公开的实施例的蛋白质结构建模方法,可基于蛋白质序列来确定结构域,并基于电子云密度图筛选结构域,进而基于目标结构域和电子云密度图进行对接,获得蛋白质结构模型,可在电子云密度图分辨率较低的情况下获得较好的建模效果,提高建模效率。CN115035947ACN115035947A权利要求书1/2页1.一种蛋白质结构建模方法,其特征在于,包括:对蛋白质序列进行结构预测,获得第一蛋白质结构信息,以及蛋白质序列的Ca原子对距离误差;根据所述Ca原子对距离误差,确定所述第一蛋白质结构信息中的至少一个结构域;根据所述蛋白质序列的电子云密度图,获得蛋白质序列片段;根据所述电子云密度图和所述蛋白质序列片段,对所述结构域进行筛选,获得目标结构域;根据所述目标结构域和所述电子云密度图,获得所述蛋白质序列的蛋白质结构模型。2.根据权利要求1所述的方法,其特征在于,根据所述Ca原子对距离误差,确定所述第一蛋白质结构信息中的至少一个结构域,包括:根据所述Ca原子对距离误差和所述蛋白质序列的长度,获得所述蛋白质序列的结构域分数,所述结构域分数表示结构域内相互作用的残基对的数量,与结构域之间相互作用的残基对的数量之比;获取蛋白质序列的局部距离差异检验值;根据所述结构域分数以及所述局部距离差异检验值,确定所述第一蛋白质结构信息中的至少一个结构域。3.根据权利要求2所述的方法,其特征在于,根据所述结构域分数以及所述局部距离差异检验值,确定所述至少一个结构域,包括:根据所述结构域分数,确定所述结构域的边界;根据所述结构域的边界,以及所述局部距离差异检验值,优化所述结构域的边界,确定所述至少一个结构域。4.根据权利要3所述的方法,其特征在于,根据所述结构域分数以及所述局部距离差异检验值,确定所述至少一个结构域,还包括:确定任意两个结构域之间,所述Ca原子对距离误差小于预设误差阈值的氨基酸残基的第一数量,其中,所述氨基酸残基中的两个Ca原子分别属于所述两个结构域;在所述第一数量大于或等于预设的数量阈值的情况下,将所述两个结构域合并为一个结构域。5.根据权利要求1所述的方法,其特征在于,根据所述蛋白质序列的电子云密度图,获得所述蛋白质序列片段,包括:根据所述蛋白质序列的电子云密度图,获得所述蛋白质序列中的氨基酸的Ca原子位置以及氨基酸类型;根据所述氨基酸的Ca原子位置以及氨基酸类型,获得所述蛋白质序列片段。6.根据权利要求1所述的方法,其特征在于,根据所述电子云密度图和所述蛋白质序列片段,对所述结构域进行筛选,获得目标结构域,包括:根据所述蛋白质序列片段,对所述结构域进行筛选,获得与所述蛋白质序列片段匹配的第一结构域;根据所述电子云密度图,对所述结构域中,除所述第一结构域之外的其他结构域进行筛选,获得第二结构域;根据所述第一结构域和所述第二结构域,获得所述目标结构域。2CN115035947A权利要求书2/2页7.根据权利要求1所述的方法,其特征在于,根据所述目标结构域和所述电子云密度图,获得所述蛋白质序列的蛋白质结构模型,包括:确定所述目标结构域在所述电子云密度图中的对接位置;根据所述对接位置和所述目标结构域,获得所述蛋白质结构模型。8.根据权利要求7所述的方法,其特征在于,所述目标结构域包括与所述蛋白质序列片段匹配的第一结构域,以及与所述电子云密度图中局部区域匹配的第二结构域,其中,确定所述目标结构域在所述电子云密度图中的对接位置,包括:分别确定所述蛋白质序列片段在所述电子云密度图中的第一位置,以及所述电子云密度图中局部区域的第二位置;根据所述第一位置和所述第二位置,确定所述对接位置。9.根据权利要求7所述的方法,其特征在于,根据所述对接位置和所述目标结构域