预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115985386A(43)申请公布日2023.04.18(21)申请号202211691945.3G06F18/2415(2023.01)(22)申请日2022.12.28G06F18/25(2023.01)(71)申请人星希尔生物科技(上海)有限公司地址200131上海市浦东新区中国(上海)自由贸易试验区加枫路8号七层702室(72)发明人王鹏磊柳俊宏刘勇李欣泽(74)专利代理机构北京中南长风知识产权代理事务所(普通合伙)11674专利代理师穆丽红(51)Int.Cl.G16B15/30(2019.01)G16B40/00(2019.01)G06N3/0464(2023.01)G06N3/0455(2023.01)G06N3/08(2023.01)权利要求书2页说明书7页附图2页(54)发明名称一种多模态药物-蛋白质靶点相互作用预测方法及系统(57)摘要本发明公开了一种多模态药物‑蛋白质靶点相互作用预测方法,包括:S1,对药物分子进行特征编码从而获取药物分子的特征表示;S2,对蛋白质靶点进行特征编码从而获取蛋白质靶点的特征表示;S3,将多模态药物分子的特征表示和多模态蛋白质靶点的特征表示进行特征融合获得融合后的相互作用特征;S4,将融合后的相互作用特征作为分类器的输入,基于带标签训练集对预测模型进行训练后获得相互作用预测模型,从而基于相互作用预测模型预测药物分子和蛋白质靶点之间的相互作用。还公开对应系统及应用。通过融合药物分子和蛋白质靶点的结构与语义多模态特征,对药物分子和蛋白质靶点完整充分描述,利用Transformer网络能够对相互作用有效建模,更准确的进行DPI预测。CN115985386ACN115985386A权利要求书1/2页1.一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,包括:S1,对药物分子进行特征编码从而获取药物分子的特征表示;S2,对蛋白质靶点进行特征编码从而获取蛋白质靶点的特征表示;S3,将所述多模态药物分子的特征表示和所述多模态蛋白质靶点的特征表示进行特征融合获得融合后的相互作用特征;S4,将融合后的相互作用特征作为分类器的输入,基于带标签训练集对预测模型进行训练后获得相互作用预测模型,从而基于所述相互作用预测模型预测药物分子和蛋白质靶点之间的相互作用。2.根据权利要求1所述的一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,所述S1包括:S11,利用RDKit工具将分子的SMILES序列表示转换为图结构表示,并基于图结构表示得到相应的分子图特征;S12,将分子图特征作为输入,通过图神经网络编码得到药物分子的结构特征;S13,将分子的SMILES序列作为输入,通过第一预训练模型得到药物分子的语义特征;S14,将所述药物分子的结构特征和所述药物分子的语义特征进行整合编码,得到相应的多模态药物分子的特征表示。3.根据权利要求2所述的一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,所述第一预训练模型为预训练Mol2vec模型。4.根据权利要求3所述的一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,所述S2包括:S21,基于蛋白质靶点的预测氨基酸亲和度矩阵和基于氨基酸序列匹配的特征向量构建蛋白质图,所述蛋白质图的结构特征表征蛋白质中氨基酸残基之间的空间结构关系;S22,将蛋白图特征作为输入,通过图神经网络和卷积神经网络编码得到蛋白质靶点的结构特征;S23,将所述蛋白质靶点的一维氨基酸序列作为输入,通过第二预训练模型得到蛋白质靶点的语义特征;S24,将所述蛋白质靶点的结构特征和所述蛋白质靶点的语义特征进行整合编码,得到相应的多模态蛋白质靶点的特征表示。5.根据权利要求4所述的一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,所述第二预训练模型为预训练BERT模型。6.根据权利要求5所述的一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,所述S3包括:S31,将药物分子的多模态特征Mh和蛋白质靶点的多模态特征Ph输入Transformer解码网络,利用Transformer解码网络中的多头注意力结构使药物分子的多模态特征Mh和蛋白质靶点的多模态特征Ph进行交互产生交互特征X;S32,对交互特征X在节点维度进行聚合获得融合后的相互作用特征。7.根据权利要求6所述的一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,所述S32所述聚合包括:2CN115985386A权利要求书2/2页从而得到可以描述药物‑蛋白质靶点相互作用的特征向量h;xi表示交互特征X的第i个元素。8.根据权利要求7所述的一种多模态药物‑蛋白质靶点相互作用预测方法,其特征在于,所述S4包括:S41,将药物‑蛋白质靶点相互作用特征向量h