【摘要】 对于几何优化,我们还考虑了多达 5,595 个结构异构体的松弛路径,其总和公式为 C7H10O2,来自 QM9 数据库。
基于响应算子的量子机器学习 (OQML) 中预测的能量和力,通过传统优化器执行几何优化和过渡态搜索计算,但不需要使用量子化学方法进行后续重新优化。对于小有机查询分子的随机采样初始坐标,报告了随着训练集大小的增加平衡和过渡态几何输出的系统改进。
经过多达 200 次反应物配合物弛豫和过渡训练后,使用 LBFGS 和 QST2 算法预测了样本外 SN2 反应物配合物和过渡态几何形状,均方根偏差 (RMSD) 分别为 0.16 和 0.4 Å分别来自 QMrxn20 数据集的状态搜索轨迹。
对于几何优化,我们还考虑了多达 5,595 个结构异构体的松弛路径,其总和公式为 C7H10O2,来自 QM9 数据库。将生成的 OQML 模型与 LBFGS 优化器结合使用,可重现 RMSD 为 0.14 Å 的最小几何形状,仅使用沿着训练化合物的优化路径从正常模式采样获得的约 6000 个训练点,而无需主动学习。
对于收敛的平衡和过渡态几何形状,随后的振动简正模频率分析表明与 MP2 参考结果的偏差平均分别为 14 和 26 cm−1 。虽然与密度泛函理论或 MP2 相比,OQML 预测的数值成本可以忽略不计,但在任何一种情况下,收敛之前的步骤数通常都较大。然而,达到收敛的成功率会随着训练集大小的增加而系统性地提高,这凸显了 OQML 的普遍适用性的潜力。
研究结果表明,OQML 可以跨化合物空间进行训练,以优化几何形状并搜索新的样本外查询化合物的鞍点(过渡态)。因此,已经证明了 OQML 作为传统基于量子的能量和力的替代模型的适用性,并且可以在传统优化器中使用。
最值得注意的是,随着训练集大小的增加,OQML 在 RMSD、频率和激活能方面的预测误差会系统性地改善。同样,随着训练集大小的增加,优化器收敛的成功率也会提高。报告的学习曲线表现出线性衰减,作为对数尺度上训练集大小的函数,表明模型的完整性,并且仅通过添加进一步的训练数据就可以实现预测能力的进一步提高。
RMSD 的相应性能曲线表明,基于这些模型的优化过程(RMSD 以及成功率)还可以通过增加训练集大小来进一步改进。特别是对于结构异构体(小分子、有机分子和闭壳分子),通过添加更多训练数据,势能面的描述稳步改进。例如,对于最小和最大训练集大小,成功率分别从 2% 提高到 52%。预测振动频率与参考 MP2 频率的小偏差进一步证实了这一点。
将来,可以研究探索 QM7x 数据集中远离局部最小值的非平衡几何形状[1]。为了使 OQML 更易于转移并且也适用于更大的反应物,还可以实施基于 Amon 的扩展[2]。 OQML 还有助于在量子化学中生成更大、更一致的数据集,特别是对于反应的研究。
[1]J. Hoja, L. Medrano Sandonas, B. G. Ernst, A. Vazquez-Mayagoitia, R. A. DiStasio, and A. Tkatchenko, Sci. Data 8, 43 (2021).
[2]B. Huang and O. A. von Lilienfeld, Nat. Chem. 12, 945 (2020).
科学指南针提供各类科研测试服务,愿您总能获得想要的结果。我们收到的测试样品来自各地,种类繁多,如果我们回复不及时,还请再次联系,或直接语音电话联络,若您对我们的服务不满意,或对测试结果有疑问,请果断联系我们或直接拨打400-831-0631,我们对每个数据及结果,会负责到底!科研可能很苦,但坚持一定很苦,愿您顺利!
免责声明:部分文章整合自网络,因内容庞杂无法联系到全部作者,如有侵权,请联系删除,我们会在第一时间予以答复,万分感谢。