预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109887541A(43)申请公布日2019.06.14(21)申请号201910117693.5(22)申请日2019.02.15(71)申请人张海平地址518055广东省深圳市南山区西丽深圳大学城学苑大道1068号申请人廖麟卜魏彦杰王昊吴序栎(72)发明人张海平廖麟卜王昊魏彦杰吴序栎(74)专利代理机构深圳市君胜知识产权代理事务所(普通合伙)44268代理人王永文刘文求(51)Int.Cl.G16B20/00(2019.01)G16B40/00(2019.01)权利要求书2页说明书12页附图4页(54)发明名称一种靶点蛋白质与小分子结合预测方法及系统(57)摘要本发明提供了一种靶点蛋白质与小分子结合预测方法及系统,通过获取待结合蛋白质口袋和待查询小分子的物理化学特征数据;将所述待结合蛋白质口袋和待查询小分子的物理化学特征数据分别转化为口袋向量和小分子向量;将所述口袋向量和小分子向量作为输入预先设置的基于深度神经网络的预测模型,得到结合概率的预测结果。本发明所提供的方法及系统,提取了相互作用直接相关的活性口袋部分表示蛋白,有利于去除非相关信息,减少噪音,进而提高准确性。另外,设计了适合学习向量的神经全连接层网络模型更容易保留更全的信息,通过向量保留了蛋白小分子作用的关键信息,但是又不依赖于蛋白小分子复合物构象,为高速准确预测奠定了基础。CN109887541ACN109887541A权利要求书1/2页1.一种靶点蛋白质与小分子结合预测方法,其特征在于,包括:获取待结合蛋白质口袋和待查询小分子的物理化学特征数据;将所述待结合蛋白质口袋和待查询小分子的物理化学特征数据分别转化为口袋向量和小分子向量;将所述口袋向量和小分子向量作为输入预先设置的基于深度神经网络的预测模型,得到结合概率的预测结果。2.根据权利要求1所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述方法还包括:获取蛋白-小分子复合物结构数据,并将所述蛋白-小分子复合物结构数据作为正样本集,以及为每个蛋白随机组合一个所述蛋白-小分子复合物结构中不含有的小分子作为负样本集,对所述预测模型进行训练,并结合输出结果,对预测模型进行参数调整。3.根据权利要求2所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述对所述预测模型进行训练的步骤还包括:将所述正样本集和所述负样本集的数据分成训练集、验证集和测试集;使用所述训练集对预测模型进行训练得到预测模型的参数;使用所述验证集对所述预测模型进行验证得到优化后的模型参数;使用测试集对所述预测模型进行测试,得到预测模型的输出结果与真实结果之间的误差值。4.根据权利要求1-3任一项所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述预测模型为基于密集全连接神经网络构建的预测模型,其输出层的激活函数为线性整流函数。5.根据权利要求1所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述将所述口袋向量和小分子向量作为输入预先设置的基于深度神经网络的预测模型,得到结合概率的预测结果的步骤包括:根据预测输出的结合概率值对所述结合蛋白进行概率值排名,以及根据所述概率值排列名次得到小分子最佳结合靶点蛋白。6.根据权利要求2所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述获取蛋白-小分子复合物结构数据的步骤包括:提取蛋白-小分子复合物结构中距离小分子一纳米以内的蛋白质氨基酸作为蛋白质口袋,或者利用Fpocket软件提取未知蛋白-小分子复合物结构中潜在的蛋白质口袋并进行打分,并将打分高于预设值的活性口袋作为蛋白质口袋。7.根据权利要求6所述的靶点蛋白质与小分子结合预测方法,其特征在于,获取蛋白-小分子复合物结构数据的步骤还包括:将所述蛋白质口袋和小分子的物理化学特征数据分别转化为口袋向量和小分子向量;组成向量化后的蛋白-小分子复合物数据库。8.一种靶点蛋白质与小分子结合预测系统,其特征在于,包括:数据获取模块,用于获取待结合蛋白质口袋和待查询小分子的物理化学特征数据;向量化模块,用于将所述待结合蛋白质口袋和待查询小分子的物理化学特征数据分别转化为口袋向量和小分子向量;2CN109887541A权利要求书2/2页预测处理模块,用于将所述口袋向量和小分子向量作为输入预先设置的基于深度神经网络的预测模型,得到结合概率的预测结果。9.根据权利要求8所述的靶点蛋白质与小分子结合预测系统,其特征在于,所述系统还包括:模型训练模块,用于获取蛋白-小分子复合物结构数据,并将所述蛋白-小分子复合物结构数据作为正样本集,以及为每个蛋白随机组合一个所述蛋白-小分子复合物结构中不含有的小分子作为负样本集,对所述预测模型进行训练,并结合输出结果,对预测模型进行参数调整。10.根据权利要求