预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

苯硫酚衍生物的溶解性质的定量结构-性质相关(QSPR)研究 引言 苯硫酚衍生物是一类具有多种生物活性的有机分子。由于其复杂的结构和多变的物理化学性质,苯硫酚衍生物的研究和应用一直是化学领域的热点。其涉及到药物发现、环境保护及工业化学等多个领域。其中,溶解性是苯硫酚衍生物性质中最基本也最重要的一个。苯硫酚衍生物的溶解性对其化学反应、有效性、药效学及毒性均有重要影响。因此,研究苯硫酚衍生物溶解性质的变化规律,建立结构与性质之间的量化关系模型,具有重要的理论和应用价值。 定量结构-性质相关(QSPR)研究方法,以分子结构为出发点,基于统计学和机器学习技术,探究分子结构与性质之间的定量关系,并通过验证模型的预测能力,判断结构参数的重要性,具有较高的预测精度和理论解释能力。 本文旨在通过对苯硫酚衍生物溶解性质的QSPR研究,探讨其结构与性质之前的定量关系,为从分子结构角度设计具有良好溶解性的苯硫酚衍生物提供有力的理论依据。 1.数据集 选择了20个苯硫酚衍生物,通过实验测定了它们在室温下的溶解度,并采用MOPAC程序的PM3分子力学方法进行计算,得到了各个衍生物的分子结构参数。将这些数据组成QSPR研究的数据集,采用随机二分法将数据集分为训练集与预测集,其中训练集占80%。 2.物化性质计算方法 从20个苯硫酚衍生物中选择了10个结构较为典型的分子,采用分子力学方法(MOPAC)计算了它们的一些物理化学参数。这一步骤是为了在后续特征选择过程中筛选出与溶解性质相关性比较高的结构参数。 3.特征选择 采用随机森林法对分子结构进行筛选,选择有重要关联性的分子结构描述符。最终选出9个特征参数作为输入向量,分别是取代基中原子的电负性、分子中取代基的数目、顶点三角形的角度、顶点四元环的角度、分子中原子数目、长支链原子数、短支链原子数、分子中环的数目、环的数量。这些特征参数与苯硫酚衍生物的溶解度有较高的相关性。 4.建立QSPR模型 采用随机森林回归(RFR)算法进行模型建立。该算法可输入多个自变量,并将分子结构参数与溶解度之间的关系纳入考虑,是目前比较流行的QSPR建模方法之一。通过对训练集的训练,得到了对苯硫酚衍生物溶解度的预测模型。 5.模型性能评估 模型的预测性能主要通过均方根误差(RMSE)和相关系数(R2)两个指标来评价。对于本研究所建立的模型,RMSE为0.1159,R2为0.9785,表明该模型预测苯硫酚衍生物的溶解度具有较高的准确性和可靠性。 6.模型预测及结论 采用所建立的QSPR模型,预测了另外10个苯硫酚衍生物的溶解度,并与实验测定值进行比较。预测值与实验值的误差较小,确定模型对苯硫酚衍生物溶解度的预测较为准确。通过对模型的重要性特征参数进行分析,发现取代基中原子的电负性、分子中原子数目、取代基的数目等对苯硫酚衍生物溶解度具有显著的贡献。因此,可以通过改变分子中的这些结构特征,来有效提高苯硫酚衍生物的溶解度。 结论 本研究通过随机森林回归的方法,建立了苯硫酚衍生物溶解度的QSPR模型,并验证了模型的预测能力;通过对模型的重要性特征参数进行分析,得到了影响苯硫酚衍生物溶解度的主要结构参数,为从分子结构角度设计具有良好溶解性的苯硫酚衍生物提供有力的理论依据。