学位专题

<
DOI:10.7666/d.Y1548630

面向互动型网络媒体的不良信息检测与过滤

魏善岭
大连海事大学
引用
互动式网络媒体技术使得信息传播形式由传统的单向进行转变为交互式的双向进行。它具有快捷性、多渠道性和广泛性等特点。另一方面,互动式网络也为不良信息的发布提供的便利渠道。本文以网络论坛为研究对象,对面向互动型网络媒体的不良信息检测与过滤进行了研究。主要内容如下: (1)实现网络论坛信息的自动抽取。本文分别从网络论坛站点结构和页面信息块进行信息抽取,采用基于HTML结构的信息抽取技术,先用HTML解析器将HTML文档解析成DOM树,然后通过对DOM树的操作实现信息抽取。 (2)实现了面向网络论坛文本的预处理和模型表示。根据网络论坛的结构特点,提出了一种改进的特征权重算法来计算特征项的权重,采用基于词条的向量空间模型来表示网络论坛文本的内容,向量中的每一维元素被称为一个特征项。 (3)建立网络不良信息过滤器。分析和总结了不良信息的内容、结构和传播特征,根据不良信息的特点,采用了一种基于朴素贝叶斯的改进算法,建立了不对称贝叶斯过滤器,并根据过滤模型的评价指标验证信息过滤的效率。 (4)设计并实现了互动网络媒体不良信息过滤系统。采用二级过滤策略,将基于关键词过滤技术和内容过滤技术有机结合,对经关键词过滤后的可疑样本再进行内容过滤;根据不良信息分布的不均衡性,建立了朴素贝叶斯分类器和不对称贝叶斯分类器进行信息过滤;最后,通过实验比较了两种分类器的性能。

计算机网络;网络媒体;信息过滤;网络管理

大连海事大学

硕士

计算机科学与技术

鲁明羽

2009

中文

TP393.07;TP311.13

56

2009-12-30(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅