学位专题

目录>
<

基于卷积神经网络的糖尿病病情预测研究

何泊
西南大学
引用
糖尿病是一种常见的慢性非传染病,该种疾病主要表现是患者体内由于代谢紊乱而长期存在高血糖水平。该种疾病不易治愈,患者体内长期存在的高血糖值给患者的肾脏,心脑血管,神经系统等部位带来严重的危害,会引发诸多并发症,给患者的身心健康带来极大的伤害。然而,由于人口老龄化和人们不良的生活习惯,糖尿病的发病率依然高居不下,更呈现上升态势。可见,糖尿病的预防和治疗已成为亟待解决的医疗健康问题。  随着医疗信息化的发展,各个医疗机构在病人的诊疗过程中也积累了海量的患者医疗电子数据。充分利用大量医疗数据,从中挖掘有价值的治疗规律,将规律用于辅助医生诊疗,可以缓解部分地区医疗资源紧张的问题;还有助于医师根据患者的病情发展及时调整治疗方案,提高治疗效率。机器学习作为一门多领域交叉学科,近些年得到了很大的发展。深度学习作为机器学习的分支,由于其强大的特征提取能力,可以发掘数据更深层次的特征,因此被广泛地应用于人脸识别,语音识别等诸多实际应用领域。将深度学习的强大信息挖掘功能应用于医疗数据挖掘,发掘数据之间潜在的有价值信息将会极具实际意义和社会价值。  本文基于经过数据分析和特征处理后的糖尿病病人的入院病历记录,利用改进的卷积神经网络算法建立了预测糖尿病病情变化模型。该模型可以辅助医生根据住院病人诊疗的病例记录,利用模型判断病人的治疗效果,对住院病人出院后再次入院的风险进行预测,从而对治疗方案的有效性进行判别 。本文所做的主要工作如下:  1、提出了对病例数据进行数据统计分析和特征处理。由于本研究所用数据集是从医院获得的真实数据,该数据集数据量较大,维度较高,并且存在缺失值。为了保证在接下来的分析都可以建立在良好的结构化数据上,本实验首先对数据集进行数据分析。本文首先对缺失值进行清洗; 对数据集的数据分布进行分布统计,确定数据的分布特征。针对数据集中类别分布不均衡的现象,利用基于少数类权重过采样技术进行数据均衡;利用孤立森林算法进行异常数据检测,找出异常数据进行删除,从而获取统计学上较为光滑的数据;使用Xgboost算法进行特征权重排序,去除对分类结果无贡献的特征,进行特征精简。  2、本研究提出了基于卷积神经网络和集成学习的CNN-EI算法。本研究分析了本数据模型的特点,选用卷积神经网络为预测模型,并结合了集成学习的良好的数据分类能力对卷积神经网络进行算法改进,希望能够获得更好的预测效果来辅助医生诊疗。  3、为了验证本文提出的数据处理方法的必要性和模型的有效性,研究过程中加入了对比实验。实验结果表明,与传统的卷积神经网络和分类算法相比,本研究的确有良好的可靠的预测效果,并且数据处理部分对模型性能的提升也大有裨益。  4、本研究根据上述的研究成果构建了一个糖尿病病情发展预测模型,通过该模型可以用来实现对病人病情发展趋势的进行判断,判断病人短期内再次入院的可能性。

糖尿病;辅助诊疗;数据分析;机器学习;病情预测

西南大学

硕士

计算机系统结构

张衡

2019

中文

TP183

2019-12-10(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅