学位专题

目录>
<

机器学习方法用于FMS样酪氨酸激酶抑制剂的构效关系研究

赵云阳
北京化工大学
引用
FMS样酪氨酸激酶3(FLT3)是治疗急性髓系白血病(AML)的重要靶点。近年来在多数AML患者中发现了FLT3的过度表达和突变。因此本文进行了FLT3抑制剂的构效关系研究。主要研究内容如下:  (1)FLT3抑制剂的高低活性分类研究。收集了含有3867个人源野生型的FLT3抑制剂数据集。运用随机森林(RF)、支持向量机(SVM)、极致梯度提升树(XGBoost)、深度神经网络(DNN)和循环神经网络(RNN)算法共建立了 39个定性分类模型。四个最优模型 Model 3A(SVM 模型)、Model 3C(SVM 模型)、Model 3H(XGBoost模型)和Model 3L(DNN模型)对测试集的马修斯相关系数(MCC)在0.70到0.72之间,预测准确率(Q)在84.95%到85.83%之间;对外部测试集的MCC在0.70到0.82之间,预测准确率(Q)在85.05%到90.97%之间。  (2)基于模型和聚类进行构效关系分析。计算了描述符的信息增益(IG)以及在高低活性抑制剂中的频率差异,发现2-氨基嘧啶、1-乙基六氢吡啶、2,4-双(甲基氨基)甾啶等分子片段为高活性抑制剂中的重要片段。随后,结合决策树算法生成的树状图,通过描述符组合得到了 2个高活性骨架和1个低活性骨架。除此之外,采用K-means聚类总结了 FLT3抑制剂的骨架结构类型和代表性侧链特征。  (3)FLT3抑制剂活性的定量预测研究。收集了 411个放射性测定方法测定的FLT3抑制剂及其IC50值。基于支持向量机(SVM)和随机森林(RF)两种算法共建立了 48个定量预测模型。最优模型Model 8G(RF模型)对测试集的决定系数(R2)为0.715,均方根误差(RMSE)为0.557。对描述符分析后发现分子的相对分子质量、复杂度以及分子不饱和键数目与FLT3抑制剂活性的相关性较大。

FLT3抑制剂;构效关系;机器学习;急性髓系白血病

北京化工大学

硕士

化学工程与技术

阎爱侠

2023

中文

R979.1

2023-09-27(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅