预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115762658A(43)申请公布日2023.03.07(21)申请号202211441111.7G06N3/042(2023.01)(22)申请日2022.11.17G06N3/045(2023.01)G06N3/0464(2023.01)(71)申请人四川大学G06N3/047(2023.01)地址610000四川省成都市一环路南一段G06N3/048(2019.01)24号G06N3/0985(2023.01)(72)发明人蒲雪梅郭佳丽孙明杨松燃胡际帆(74)专利代理机构四川省成都市天策商标专利事务所(有限合伙)51213专利代理师张秀敏(51)Int.Cl.G16C20/30(2019.01)G16C20/20(2019.01)G16C20/70(2019.01)G16C20/90(2023.01)权利要求书3页说明书12页附图7页(54)发明名称基于图卷积神经网络的共晶密度预测方法(57)摘要本发明公开了基于图卷积神经网络预测共晶密度的方法,包括收集共晶样本并进行筛选和数据增强得到共晶数据;对共晶体中两个单独分子分开用分子图的方式表征各个分子的结构,再采用拼接操作将两个分子的信息整合为共晶体的图信息,探索共晶体中分子的2维描述符和3维描述符作为全局特征对预测模型的影响;共晶样本随机划分5%做测试集,剩下的共晶样本做十倍交叉验证用于模型超参数寻参;引入全局注意力机制,构建了基于图卷积神经网络的深度学习框架进行共晶密度预测。本发明实现对共晶体中异质分子间的相互作用的有效识别和共晶体密度性质进行快速预测。CN115762658ACN115762658A权利要求书1/3页1.一种基于图卷积神经网络的共晶密度预测方法,其特征在于,包括:步骤S100、数据收集:从晶体结构数据库CSD中收集共晶样本,考虑数据质量结合化学计量比对共晶样本进行筛选,采用交换共晶中两个分子的顺序做数据增强,得到共晶数据;步骤S200、数据处理:对共晶体中两个单独分子分开用分子图的方式表征各个分子的结构,再采用拼接操作将两个分子的信息整合为共晶图,在探索样本表征过程,选取共晶体中分子的2维描述符和3维描述符作为全局特征输入模型;所述模型基于图卷积神经网络的深度学习框架,由一个图卷积神经网络的特征提取器和一个三层的全连接层神经网络预测器组成;步骤S300、数据集划分:共晶样本随机划分5%做测试集,剩下的共晶样本做十倍交叉验证用于模型超参数寻参;步骤S400、引入全局注意力机制,提出基于共晶图卷积神经网络的深度学习回归模型CCPGraph,进行共晶密度预测。2.根据权利要求1所述的一种基于图卷积神经网络的共晶密度预测方法,其特征在于,考虑数据质量结合化学计量比对共晶样本进行筛选,采用交换共晶中两个分子的顺序做数据增强,具体包括:(1)过滤掉不是由两个异质分子组成的晶体,保留常温下是固态的双组分晶体样本;(2)删除没有密度值的共晶样本;(3)排除含有金属元素的共晶体,保留含碳元素的分子组成的共晶体,移除盐类、含有溶剂和晶体乱序的样本;(4)针对多晶型的共晶样本,选用密度最大值作为该晶体的最终密度值;(5)将共晶数据按计量比划分三组,分别是1:1、1:2或2:1和其它计量比;(6)对共晶分子进行顺序交换,增加训练样本的数量,实现数据增强的目的。3.根据权利要求1所述的一种基于图卷积神经网络的共晶密度预测方法,其特征在于,所述步骤S200具体包括:定义共晶图:对每一个共晶体,读取共晶体的两个成分分子的序列信息,采用原子表示节点、共价键表示边的方式对每个分子的图结构进行表征得到分子图;再将两个分子的原子信息和边信息拼接起来,组成共晶体的原子特征矩阵和表示共价键的边特征矩阵;对每个原子通过共价键的连接将相邻原子的信息整合到该原子中;在探索样本表征过程中,计算了共晶体中分子的2维描述符和3维描述符作为全局特征,2维描述符来自于RDKit工具中计算的200个分子水平的物理化学描述符;3维描述符一部分来自于共晶分类工作中关于空间形状和大小的7个描述符,另一部分基于RDKit开源工具计算的空间作用力的10个3维分子特征作为另外一类表征分子空间结构的描述符。4.根据权利要求3所述的一种基于图卷积神经网络的共晶密度预测方法,其特征在于,定义分子图:通过分子节点和共价键边的方式表示,G=(V,E),其中V表示节点特征矩阵,它由一组原子特征向量组成,V∈Rn×d,n表示分子中所有的原子数,d表示原子的特征数目;E表示边的特征矩阵,它由一组共价键的特征向量组成,E∈Rm×c,m表示分子中所有共价键的数d量,c为共价键的类别数量;节点特征矩阵V中的节点i的特征向量表示为vi,vi∈R;节点i和c节点j形成边的特征向量表示为