10.3969/j.issn.1000-386X.2009.12.052
基于Web文本挖掘的论坛监控系统的设计
当前BBS论坛日益成为人们通过网络进行信息交换的中心,被越来越多的用户使用.为了营造一个健康的网络环境,从网页抓取、信息抽取到主要的文本挖掘技术中文分词、特征表示和提取、文本分类和聚类等方面进行了详细的介绍,同时阐述了其工作原理.此系统不仅可以防止恶意言论的传播,还大大节约了人力,极大地提高了工作效率.
网页抓取、信息抽取、中文分词、特征抽取、文本分类、文本聚类
26
TP3;F7
2010-03-02(万方平台首次上网日期,不代表论文的发表时间)
共3页
161-163