预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114974461A(43)申请公布日2022.08.30(21)申请号202210675286.8(22)申请日2022.06.15(71)申请人烟台国工智能科技有限公司地址264000山东省烟台市经济技术开发区五指山路1号5楼517室(72)发明人柳彦宏戴开洋却立勇(74)专利代理机构济南信达专利事务所有限公司37100专利代理师罗文曌潘悦梅(51)Int.Cl.G16C20/50(2019.01)G16C20/70(2019.01)G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书4页说明书9页附图2页(54)发明名称基于策略学习的多目标属性分子生成方法及系统(57)摘要本发明公开了基于策略学习的多目标属性分子生成方法及系统,属于分子生成预测技术领域,要解决的技术问题为如何生成同时满足多目标属性的分子。包括如下步骤:基于Stack‑RNN构建分子生成器;获取SMILES字符串形式的类药物化合物对分子生成器进行预训练;对于每种分子属性,基于随机森林构建对应的分子属性预测器;以SMILES字符串形式的分子为输入、分子属性值为输出训练分子属性预测器;将预训练后分子生成器及每个训练后分子属性预测器并入强化学习系统,以预训练后分子生成器为智能体、每个训练后分子属性预测器为评审对预训练后分子生成器进行参数优化,通过最终分子生成器输出同时满足多目标属性的分子。CN114974461ACN114974461A权利要求书1/4页1.一种基于策略学习的多目标属性分子生成方法,其特征在于包括如下步骤:基于Stack‑RNN网络模型构建分子生成器,所述分子生成器用于以SMILES字符串形式的类药物化合物为输入,通过学习SMILES字符串中隐藏的形成规则,输出有效的SMILES字符串形式的分子;获取大量SMILES字符串形式的类药物化合物构建训练集,以所述训练集为输入对所述分子生成器进行预训练,得到预训练后分子生成器;对于每种分子属性,基于随机森林模型构建对应的分子属性预测器,所述分子属性预测器用于以SMILES字符串形式的分子为输入、预测并输出分子属性值;获取大量标识有分子属性的分子,对于每个分子属性预测器,以SMILES字符串形式的分子为输入、以分子属性值为输出训练所述分子属性预测器,得到训练后分子属性预测器;将所述预训练后分子生成器以及每个训练后分子属性预测器并入强化学习系统,以所述预训练后分子生成器为智能体,以每个训练后分子属性预测器为评审,对所述预训练后分子生成器进行参数优化,得到最终分子生成器,通过所述最终分子生成器预测输出同时满足多目标属性的分子。2.根据权利要求1所述的基于策略学习的多目标属性分子生成方法,其特征在于对所述训练集进行预处理,将字符串长度大于阈值的SMILES字符串删除,得到预处理后训练集,以所述预处理后训练集为输入对所述分子生成器进行预训练。3.根据权利要求1所述的基于策略学习的多目标属性分子生成方法,其特征在于所述分子生成器包括:输入层,所述输入层中神经元的个数与训练集中所有SMILES字符串不重复字符的个数相同,所述SMILES字符串的one‑hot编码向量作为所述输入层的输入;GRU层,所述GRU层配置有多个神经元,用于对输入的SMILES字符串进行过滤,去除无效信息;Stack层,所述Stack层中配置有多个神经元,用于执行三种操作,分别为POP操作、PUSH操作和NO‑OP操作,所述POP操作用于删除Stack层最上端的元素,PUSH操作用于插入一个新元素到Stack层最上端,NO‑OP操作为不进行任何操作;输出层,所述输出层中神经元的个数与训练集中所有SMILES字符串不重复字符的个数相同,用于基于前序序列字符预测并输出下一个字符的概率分布;所述Stack最上端元素的值的计算公式为:其中,,是Stack控制变量;当时,Stack层最上端的值被下一个值替代;当时,新值加入到Stack层最上端,其它值依次下移;当时,最上端的值不变;Stack层中深度为i>0的元素与所述Stack最上端元素的操作规则相同,其值计算公式如下:2CN114974461A权利要求书2/4页t时刻隐藏层输出值ht的计算公式如下:其中,,是t‑1时刻Stack层前k个值。4.根据权利要求1所述的基于策略学习的多目标属性分子生成方法,其特征在于对于每个分子属性预测器,将所述SMILES字符串形式的分子转换为fingerprint向量,以fingerprint向量为输入、以分子属性值为输出,对所述分子属性预测器进行训练。5.根据权利要求1‑4任一项所述的基于策略学习的多目标属性分子生成方法,其特征在于以所述预训练后