10.3969/j.issn.2095-2163.2023.01.026
基于机器学习的糖尿病预测及SHAP特征分析
为了提升糖尿病诊断的准确率,找出糖尿病的影响因素,将机器学习算法应用于糖尿病诊断,建立糖尿病预测模型,为医生提供决策指导.实验使用UCI数据库中的皮马印第安人糖尿病数据集,首先对数据进行缺失值填充、异常值处理与标准化等预处理;在经过预处理后的数据集上建立单分类模型和集成学习模型,并通过5折交叉验证准确率和AUC值评估各模型的预测性能.结果表明,XGBoost算法的预测效果最好,分类准确率达到77.83%,AUC值为0.822.最后,引入SHAP模型增强模型的可解释性,归纳得出葡萄糖浓度、身体质量指数和年龄对糖尿病预测具有重要影响.
糖尿病、机器学习、疾病诊断、SHAP特征分析
13
R587.1;TP181(内分泌腺疾病及代谢病)
国家自然科学基金62072296
2023-02-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
153-157