10.3969/j.issn.1671-1122.2013.07.015
基于简易密写架构的维文反过滤技术研究
目前Web内容的过滤和审计注重从Web元素中删除噪音(如作为HTML、XML等文档结构元素的标签)后,对纯Web文本中的明显的关键词/敏感词或URL地址进行过滤。忽略了除了文本以外的网页元素(如颜色、字体、表格、框架、图片、音视频等)和基于语言特征的隐藏信息的发现和过滤。利用这些元素和维吾尔文特征则正好可以用来隐藏关键词/敏感词或URL信息,从而躲避信息的过滤。利用维吾尔文词语间隔、段落间隔空间和像逗号、句号等标点符号混合使用的方法可以实现在Web文本中嵌入敏感词语和URL信息并可隐藏它们,从而可以实现信息的反过滤。
反过滤、密写术、简易架构、维文
TP309(计算技术、计算机技术)
国家自然科学基金[61063043]、国家社会科学基金[11BTQ029、13CFX055]、新疆社会科学基金[11BTQ127]、新疆多语种信息技术重点实验室开放课题049807
2013-10-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
56-60