学位专题

<
DOI:10.7666/d.d222123

频繁子图挖掘算法及其在分类信息挖掘中的应用研究

廖强
三峡大学
引用
数据挖掘是一种融合了包括人工智能、统计学、数据库、模式识别、模式可视化等多种学科知识的信息整合分析技术,是计算机科学与网络技术迅速发展和使用所提出的重要科研课题,它试图从数据库的海量信息中发掘并提取出蕴藏在信息中的未知的、有用的、高效的、有价值的知识模式。通过挖掘所获取的有用的知识可以用于针对旧业务分析及新业务领域开拓的相关决策支持。  随着互联网Internet的迅速普及及高速发展,越来越丰富多样的Web数据逐渐沉淀下来,如何利用这些海量的信息为网站经营者提供决策支持的引起了各学科学者的研究。Web页面产生的各种数据信息包括电子商务数据、企业门户网站数据、分类信息推荐等主要的几类。研究者期望能通过对蕴藏在海量信息中的有价值信息进行发掘,发现能指导商务活动、新业务开拓的知识,以为获得更多的经济效益。由此,把数据挖掘技术应用到WEB数据对象中去是非常适合的。  本文将频繁模式挖掘的中的图挖掘研究方法引入到Web数据挖掘中来,它是数据挖掘的一个重要分支,其利用图数据结构特点分析大量数据集之间的有意义的关系、趋势和相关模式。  本文首先介绍了Web数据挖掘及子图挖掘在国内外的研究现状,接着阐述了课题的研究背景及意义,而后详细介绍和分析了Web数据挖掘的常用技术,比较研究了频繁模式及子图挖掘的相关算法,最后将研究成果与大学生创业项目97大学路网站结合起来,发挥研究成果决策的推荐作用。针对子图挖掘研究内容,本文改进了一种基于局部重构树的改进频繁子图挖掘算法,该算法引入一种新的频繁递减重构树来替代FP-tree结构,通过分析重构FP-tree过程,减少了挖掘时间并且具有良好的压缩性能。

Web页面;数据挖掘;频繁子图挖掘算法;压缩性能

三峡大学

硕士

计算机应用技术

蒋廷耀

2012

中文

TP393.09

62

2012-11-02(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅