学位专题

目录>
<
DOI:10.7666/d.y640922

基于决策树的CON-MINER数据挖掘模型设计与实现

苏伟
上海海事大学
引用
近年来,随着国际集装箱运输的蓬勃发展,中国的港口集装箱运输一直保持着高速发展态势.在这一过程中,大量的原始数据被不断收集并存储到计算机中,但由于数据处理能力的低下,造成了目前信息丰富,知识贫乏的现状.数据挖掘——用非平凡的方法从大量数据中发现有用的知识,正是应此要求而迅速发展起来的一门科学.数据挖掘包含众多任务,分类是其中一项被广泛应用的技术.分类经过长期的发展已产生了众多算法,决策树算法就是其中一种.为了更好的总结中国集装箱运输发展情况,在导师的指导下,设计了集装箱信息管理系统和集装箱信息挖掘模型CON-MINER.该模型采用了新设计的决策树算法:CON-DM算法,保证了挖掘的有效性.另外在模型的实现过程中,采用了JAVA语言和面向对象的思想,为挖掘系统的二次开发打下了基础.决策树学习算法在数据挖掘技术中具有很重要的作用,该文首先研究了决策树学习算法中最为重要的一种ID3(Information Definition)算法,并应用相关度的概念定义了ID3的改进算法:CON-DM算法.CON-DM算法首先借鉴Med Gen算法:先对各属性进行相关性分析,将与分类属性相关度小于事先规定的阈值的属性剔除.这减少了子树的重复,有效的降低了决策树的复杂度,从而使生成的知识更容易理解.其次,CON-DM算法引进了复合度量基准取代信息增益作为决策属性选择的标准.在一定程度上解决了决策树采用信息增益基准所造成的偏向有许多值的属性的缺陷,并可改善决策树结构和分类正确率.其次,该文针对用户需求,应用CON-DM算法设计和实现了CON-MINNER数据挖掘模型.这一模型主要是根据盈利的航线和不盈利航线属性和行为,建立航线盈利预测模型,为企业决策服务.该模型首先根据这一主题建立数据仓库,并提供了展示该数据仓库的功能.通过数据仓库的数据立方体,用户可以进行不同细度层次的挖掘操作.该论文分为六章.第一章介绍了课题的背景.第二章是对数据挖掘技术的介绍.在第三章,介绍了一种挖掘技术——决策树.第四章,详细介绍CON-DM算法.第五、六章重点介绍了CON-MINER的设计方案和相关的开发工作,主要包括总体系统结构设计、数据库设计、数据模型设计、业务流程和界面风格设计.

数据挖掘;决策树;ID3算法;CON-DM算法;信息增益;相关度;Med Gen算法

上海海事大学

硕士

计算机软件与理论

杨丽萍

2004

中文

TP311.131

52

2005-05-24(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅