学位专题

<
DOI:10.7666/d.y2098011

基于B2C电子商务数据仓库的研究与设计

郑立山
广东工业大学
引用
B2C电子商务网站系统每天都会生成大量的产品交易数据和访问日志数据,这些数据中蕴含着大量有价值的信息,例如,订单的来源、客户的行为、访问者的兴趣等。分析这些数据,不仅能帮助企业决策层指导B2C电子商务网站的运营,吸引更多用户,提高销售利润还能够反映出企业在市场营销、销售推广、售后服务和财务管理等各个方面的状况。总之,对这些数据进行深入有效的分析能够帮助管理者改善客户关系、提高企业各个方面的竞争力。本文在描述了数据仓库的相关理论,包括数据仓库的概念、基本特征、系统结构,B2C电子商务的概念、OLAP多维数据分析基础上,提出了一个较完善B2C电子商务数据仓库模型,论文主要工作包含以下内容:   1.分析B2C电子商务数据仓库的用户需求,提出B2C电子商务数据仓库多层次概念模型,设计了相关的维度模型和事实集,基于该模型完成了部分维度表和事实表的物理设计。   2.分析B2C电子商务数据仓库数据源,讨论半结构化的数据源处理,针对Web访问日志,结合半结构化数据的预处理方法,提出了改进的页面媒体类型时间阈值会话识别算法。通过对不同的URL页面类型,采用不同的页面时间阈值计算方法。相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实的反映用户会话的情况,且识别的准确率有了较大提高,为后续的分析提供高效准确的数据。   3.基于本文提出的B2C电子商务数据仓库模型,构建一个实验性B2C电子商务数据仓库项目。以Zen Cart网站系统为例,确定分析主题并基于多维建模思想建立各种不同粒度的维度、数据集市,并设计一个ETL体系结构,包括ETL调度方案,数据预处理方法等。最后对订单数据进行联机分析,展示B2C电子商务数据仓库的价值。   本文提出的B2C电子商务数据仓库模型有以下特点:   1.该模型有针对性、实用性较强的特色,它涉及对内、外电子商务贸易活动中企业的各个主要方面,包括页面点击、产品销售、订单、用户对产品的评论、销售利润、仓库、订单产品、物流配送等。   2.该模型采用多层次维度设计,通过合理有效的概念分层,为企业决策层提供更好的分析视角。   最后,本文通过实验验证了模型的有效性。

B2C电子商务;数据仓库;产品交易数据;访问日志数据

广东工业大学

硕士

计算机应用技术

滕少华

2012

中文

F713.36;TP311.132.1

75

2012-09-03(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅