基于Web数据挖掘的智能比较购物系统实现机制研究
如何提供智能化的服务,帮助人们从互联网上的海量数据中获得更高质量的服务己成为国际性的研究热点.在理论研究的基础上,本文初步实现了一个基于Web数据挖掘的智能比较购物系统,完成了系统流程和框架结构的分析设计,并根据系统应用特点,提出了两段式的信息抽取工作模式和页面信息单元的概念.首先根据网页结构特点对网页进行分类,获取网页中产品信息高度密集的代码段,然后在分类的PIU基础上进行产品信息抽取.由于目前大多数的网络数据信息是嵌入在HTML网页中,而HTML标签是用来设计网页格局和外观的,语义表达能力极度缺乏,因此对PIU结构归纳分类,设计通用的抽取规则是本文系统实现的关键.本文提出了产品信息页面结构分类的初步方案,构建页面分析器进行PIU的获取和分类;结合人工智能和Web数据挖掘的理论和技术,实现了不同结构类别PIU的信息抽取规则设计.
商务智能;比较购物;Web数据挖掘;半结构化数据;页面信息单元;信息抽取
浙江工商大学
硕士
管理科学与工程
王光明
2005
中文
TP311.131;F724.6
51
2005-10-18(万方平台首次上网日期,不代表论文的发表时间)