学位专题

<
DOI:10.7666/d.y1072956

基于后关系型数据库的医疗体检数据挖掘的研究与应用

郑旭军
华东师范大学
引用
目前全世界已有成千上万个数据库系统在运行,几乎涉及人类社会生活的方方面面,无论是企事业内部的信息管理,还是各个行业的业务处理系统,以及一般的信息加工和情报检索无不以数据库技术为基础。而医疗领域由于其具有的医疗层次关系复杂、环节众多以及医疗数据结构的多维性等特点,使得采用传统的关系型数据库难以模拟出复杂的数据关系,并且存在着存取效率的问题。 同时随着医疗卫生领域中计算机技术的迅速发展,大量有关于病人的病史、诊断、检验和治疗的临床信息,以及药品管理信息、医院管理信息等医疗信息可以被精确地记录下来,从而导致医疗数据资料爆炸性增长,如何从这些海量的医疗数据中,挖掘出有用的信息,了解各种疾病之间的相互关系和各种疾病的发展规律,总结各种治疗方案的治疗效果,这将对疾病的诊断、治疗和医学研究具有重大意义。 针对医疗领域数据的特点,本文利用Cach6数据库所具有的面向对象以及多维数据结构的技术优势,将其作为数据挖掘的平台,并提出基于贝叶斯定理的损失评分函数,对医疗评价指标进行改进。同时构造了基于该损失评分函数作为遗传算法的适应度函数,并将该遗传算法与决策树算法相结合构建了混合算法(C4.5/GA),该混合算法可以改进决策树算法偏向于大数据集以及遗传算法训练时间过长的不足。通过构建的混合算法对医疗体检数据进行数据挖掘,并采用基于贝叶斯定理的损失评分函数作为医疗评价指标对医疗体检数据的模型进行评估,以发现高血压与个人的饮食结构、生活习惯、生活方式等方面的关系或规律,为降低高血压的患病率提供一定的帮助。

数据挖掘;决策树;遗传算法;医疗;Caché

华东师范大学

硕士

系统分析与集成

王新伟

2007

中文

TP311.13;R319

63

2007-09-03(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅