学位专题

目录>
<

计算机辅助酪氨酸酶抑制剂的构效关系研究

吴依洋
北京化工大学
引用
酪氨酸酶(TYR)是黑色素生成和酶促褐变反应中的关键限速酶,与皮肤美白、色素沉着疾病的治疗以及食物保鲜等关联密切。本论文以蘑菇酪氨酸酶(abTYR)抑制剂为研究对象,采用多种机器学习算法进行了TYR抑制剂活性的分类研究和定量回归研究。此外,我们也基于计算方法进行了TYR抑制剂新分子的设计,获得了一些理论上具有TYR抑制活性的新分子。本论文研究内容具体包括:  (1)基于多种机器学习算法的TYR抑制剂分类研究。基于收集得到的1097个具有IC50活性值的abTYR抑制剂,我们使用了三种指纹描述符(MACCS、ECFP4、Avalon)表征了数据集,基于支持向量机(SVM)、深度神经网络(DNN)、逻辑回归(LR)、决策树(DT)、以及随机森林(RF)算法构建了15个分类模型。预测性能最好的分类模型是由ECFP4指纹和DNN算法构建的Model5B,对测试集的预测准确度(Q)和马修斯相关系数(MCC)分别为91.36%和0.81。我们计算得到了15个分类模型各自的应用域阂值(Threshold0.90),在应用域范围内的化合物的预测结果被认为可靠性约为90%。Model5B应用域的阈值为0.4872,在15个模型中表现出了最好的覆盖性能,其应用域覆盖了99.43%的训练集和99.55%的测试集。外部测试集和decoys集被用于验证模型的泛化能力:Model5B表现出了最好性能,对decoys集的预测准确度为94.05%,并覆盖了98.48%的decoys集;对外部测试集的预测准确度和MCC值分别为84.67%和0.71,并覆盖了约99.34%的外部测试集。此外,我们基于t-SNE和K-Means算法进行了抑制剂的聚类研究,根据抑制剂的结构特征将1097个抑制剂分成了八个子集,通过对每个子集中化合物的结构进行总结分析,我们发现子集1(硫脲类TYR抑制剂)中的高活性抑制剂占比最高,高活性抑制剂约占该子集的72%,喹啉、酰胺、噻吩是该子集内高活性抑制剂中常出现的结构片段。  (2)基于多种机器学习算法的TYR抑制剂定量回归研究。我们共收集到了813个具有确切IC50值的abTYR抑制剂用于定量研究,然后基于813个抑制剂的结构计算了用于表征抑制剂的CORINA和RDKit2D描述符。通过使用三种描述符的权重排序方法(Pearson、SVM-RFE、RF-RFE),以及三种机器学习算法(SVM、RF、DNN),我们构建了14个定量回归模型。其中,由RDKit2D描述符和DNN算法建立的Model7G表现最为出色,在测试集上的决定系数(R2)为0.770,均方根误差(RMSE)为0.482。使用Williams图对Model7G的应用域进行了定义和可视化,Model7G的预警杠杆(h*)值为0.235,约98.31%的训练集化合物和88.96%的测试集化合物位于Model7G的应用域内,说明Model7G对这些应用域内的化合物的预测是可靠的。在RDKit2D描述符的分析中我们发现,一些贡献较大的描述符所代表的子结构(如硫羰基,叔胺)与分类研究中得到的片段分析结果基本一致。  (3)采用骨架跃迁的方法设计了理论上具有潜在TYR抑制活性的新分子。首先,我们基于子集1(硫脲类TYR抑制剂)中的主要骨架保留了骨架的氨基硫脲和酰基硫脲结构,然后通过骨架跃迁和分子拼接的方法总共生成了15344个新分子。之后使用本研究建立的分类模型和定量模型对15344个分子的TYR抑制活性进行预测,保留了被认为是高活性(IC50≤10μM)TYR抑制剂的7600个分子以供进一步评估。然后我们采用了类药性定量评估(QED)、不良子结构的过滤(PAINS)、合成复杂性评价(SCScore)、药代动力学评估(ADMET)、专利排查以及分子对接分析相互作用力的方法对7600个新分子进行评价筛选,最后我们得到了三个有可能成为TYR抑制剂的新分子。  本论文基于计算方法研究了TYR抑制剂的构效关系:基于多种不同的机器学习算法,构建了用于预测TYR抑制剂活性的分类模型和定量回归模型;通过描述符分析和聚类研究,得出了对TYR抑制剂活性贡献较大的结构片段;生成了理论上有很大可能成为TYR抑制剂的新分子。本论文的研究成果可以为TYR抑制剂的研发提供一定的帮助。

酪氨酸酶抑制剂;酪氨酸酶;定量预测;骨架跃迁

北京化工大学

硕士

化学工程与技术

阎爱侠

2021

中文

TS255.1

2021-09-06(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅