学位专题

<
DOI:10.7666/d.y842342

Web页面访问模式的研究

李建东
山东科技大学
引用
论文介绍了Web挖掘的定义、过程、分类和常用技术,分析了Web挖掘的难点,对三类挖掘方法进行了比较。研究了个性化网站建设所面临的问题,根据国内外在个性化网站建设方面的研究趋势,确定了课题的研究目标。 课题从用户访问网站的行为入手,利用权重平衡的频繁访问路径所反映的用户兴趣度的概念,利用Web日志挖掘技术,自动地从日志文件中发现用户访问模式——频繁访问路径;以用户兴趣为目标,根据当前用户请求的页面,寻找最匹配的频繁访问路径,预测用户下一步将要浏览的页面,动态调整网页的内容;增加缓存预送机制,缩短响应时间,使用户快捷地得到可能感兴趣的内容。算法的主要思想是:(1)Web日志挖掘得到的用户访问模式——频繁访问路径,反映了一段时间内大多数用户访问的页面序列和浏览兴趣,其中最为匹配的几条频繁访问路径很可能是当前用户感兴趣的访问序列,可以用它们来代表用户进一步的浏览行为。(2)对于频繁访问路径(d1,d2,……,dn),如果大部分用户访问次序列只是为了得到页面dn,则dn很可能是当前用户的真正感兴趣的内容,可将dn直接预送给当前用户。 以用户兴趣度为核心构建了个性化Web站点的体系结构-PWS系统。整个系统由4个部分组成:系统管理、预处理、访问模式挖掘、个性化推荐。系统实时监测用户的访问行为,根据从服务器日志中挖掘出的频繁遍历路径,动态为其推荐兴趣度最高的兴趣页面,并预送到用户的缓存中,节省了用户的访问时间和费用。最后以具体网站为应用实例,对PWS系统的实现技术进行了完善和补充,并在理论和实践两个方面进行了测试评价。 通过从Web日志中挖掘出来的用户访问模式,预测用户下一步需要的页面,为用户提供个性化的服务,并通过预送推荐页面,改善系统性能。系统绝大部分的运行是处于服务端,对用户来说是透明的。通过系统管理部分可以对系统进行灵活的参数设置和控制,使系统具有较高的灵活性和自适应性。

数据挖掘;Web挖掘;Web日志挖掘;访问模式;兴趣度;网站建设

山东科技大学

硕士

软件工程

孙忠林;聂宜茂

2005

中文

TP393.09;TP311.13

55

2006-08-31(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅