基于血清学标志物的肝癌风险预测模型研究

李鸿江

北京化工大学

下载全文

在线阅读

引用

摘要：

肝癌是一种常见的具有高死亡率的恶性肿瘤疾病。我国是肝癌大国，肝癌发病人数和死亡人均高于世界平均水平。在肝癌的诊断中，通常采用超声与甲胎蛋白进行检查，当发现疑似肝癌或者出现异常时，再通过穿刺活检的方式进行病理学分析。该方法检查结果准确性较高，但是对于患者和检查人员都会造成过多的负担。随着医疗数据的不断累积，在大量的临床数据中借助机器学习等算法工具寻找潜在的肝癌标志物，通过相关分析建立预测模型以提高肝癌诊断效率成为当前的热门研究领域。本文通过对多中心临床数据的收集与处理，利用机器学习的方式对数据进行分析建模，用于肝癌的预测和诊断，主要工作内容如下：　　（1）收集8个医学中心血液样本，通过实验测得甲胎蛋白、甲胎蛋白异质体比率和异常凝血酶原三种指标的数据，而后通过医院的电子病历系统查找样本的背景信息。通过数据清洗，得到了可用的多中心队列临床数据。　　（2）基于性别、年龄、甲胎蛋白、总胆红素、甲胎蛋白异质体比率、血小板计数和异常凝血酶原七个指标建立了肝癌诊断模型。在阈值为-2.316时，模型在测试集中的准确率为94.41%，AUC为0.954，敏感性为88.04%，特异性为94.85%，优于现有模型。通过公式将模型预测结果转换为风险预测等级，便于临床应用。　　（3）基于多中心数据通过嵌套交叉验证的方法评判支持向量机、决策树、逻辑回归、朴素贝叶斯、K近邻、神经网络六种机器学习模型的预测能力。并基于集成学习的思想，对基模型使用套袋法（Bagging）、提升法（Boosting）和堆叠法（Stacking）三种集成方式建立了预测能力更强的模型。最终，筛选出四种F1分数大于0.7的机器学习方法，并将其应用在数据集中，表现出良好的性能。　　本文通过收集全国多个医学中心的数据建立模型，更符合中国患者的情况，研究结果可为临床医生在肝癌的早筛早诊时提供决策支持，降低医疗负担、增加早期肝癌检出率、提高患者生存率提供一定的帮助。

关键词：肝癌;机器学习;预测模型;血清学标志物

授予单位：北京化工大学

授予学位：硕士

学科专业：化学工程与技术

导师姓名：喻长远

学位年度：2022

语种：中文

分类号：R735.7;TP181

在线出版日期：2022-11-02（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于血清学标志物的肝癌风险预测模型研究