10.3969/j.issn.1000-386x.2017.07.056
基于隐马尔科夫模型与语义融合的文本分类
提出一种融合语义的隐马尔科夫模型用于文本分类的方法.将特征词的语义作为先验知识融合到隐马尔科夫分类模型中.通过信息增益提取特征词,用word2vec提取特征词语义,将每一个类别映射成一个隐马尔科夫分类模型,模型中状态转移过程就是该类文本生成过程.将待分文本与分类模型做相似度比较,取得最大类别输出概率.该方法不仅考虑特征词、词频、文档数量先验知识,而且将特征词语义融合到隐马尔科夫分类模型中.通过实验评估,取得了比原HMM模型和朴素贝叶斯分类模型更好的分类效果.
隐马尔科夫模型、语义融合、word2vec、信息增益、文本分类
34
TP3(计算技术、计算机技术)
2017-08-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
303-307