10.7536/j.issn.0252-3116.2013.14.022
面向新闻领域的中文文本分类研究综述
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用.其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施.最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合.
新闻分类、文本分类、机器学习、中文信息处理
57
G250;TP391(图书馆学、图书馆事业)
江苏省社会科学基金项目"数字报纸的自动标引研究"09TQC011;教育部人文社会科学研究项目"电子报纸内容深加工研究"09YJC870014
2013-11-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
134-139