学位专题

目录>
<
DOI:10.7666/d.y640877

基于SQL Server构建数据挖掘解决方案的研究及应用

郝瑞吉
上海海事大学
引用
DM是近年来信息产业界讨论和研究的一个热点,目前DM的研究大多集中在算法方面.大多数DM系统无法与数据存储的主要介质数据库无缝集成,同时由于数据挖掘标准语言的欠缺,使DM技术的应用范围仅仅限于领域专家.因此将DM与数据库紧密耦合及数据挖掘标准语言的开发,已经成为当前DM领域中新的研究热点.该文就是在这样一个大背景下,结合上海市教委重点学科沪教委科(2001)71资助的中法合作项目"数据挖掘在GIS中的应用",研究了基于SQL Server构建数据挖掘解决方案的方法以及DM技术在GIS中的应用.该文主要做了以下几个方面的工作:第一,该文研究了OLE DB For DM和PMML两种标准DM语言,探讨了支持这两种标准语言的SQL Server的基本结构,在此基础上研究了基于SQL Server分析服务构建数据挖掘解决方案的方法,构造了相应的系统结构,给出了软件开发实例,利用OLE DB For DM中定义的DDL以及DSO分别从客户端和服务器端完成了DM模型的创建、训练和存储,达到了DM、数据库和应用程序一体化的目标.第二,该文研究了将自主开发的DM算法外挂于SQL Server构建数据挖掘解决方案的方法,构造了系统结构,给出了软件开发实例.第三,该文重点研究了如何在SQL Server中集成自主开发的DM算法,给出了整体实现框架,并在VC++7.0下实现了DM算法的集成,将DM算法与SQL Server数据库无缝集成到了一起,使得DM算法符合OLE DB For DM,利用该算法构建了DM模型,做出了预测查询.第四,该文研究了DM在GIS中的应用,探讨了DM与GIS的集成,提出了一种DM与GIS集成的结构,构造了智能航线设计系统,将自主开发的复合聚类分析算法以模块形式外挂于SQL Server的方式应用到了智能航线设计系统中,完成了航线设计,同时该文还基于SQL Server分析服务构建了GIS数据挖掘解决方案,创建了GIS数据挖掘模型,并将该模型以PMML标准形式存储,给出了详细的船舶分布统计信息.第五,该文比较了三种基于SQL Server构建数据挖掘解决方案的优缺点,得出了理想的构建数据挖掘解决方案的方法,为数据挖掘的广泛应用提供了一条新的思路,同时对利用复合聚类分析算法和微软聚类算法设计的航线进行了分析比较.

数据挖掘;SQL Server;算法集成;地理信息系统;航线设计

上海海事大学

硕士

控制理论与控制工程

汤天浩;施伟锋

2004

中文

TP311.13

81

2005-05-24(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅