10.3969/j.issn.1009-0134.2016.02.004
面向制造领域文本的多标签分类方法
机械制造领域存在大量的领域知识,这些领域知识将特征项与文本类别关联起来,有助于区分文本的类别.基于此,本文提出一种融合领域知识的多标签分类方法旨在提高机械制造领域文本的分类性能,该方法首先采用融合领域知识的x2统计特征选择方法得到文本表示特征项集合和对应的相关度矩阵R,R反映了各特征项与类别的相关度;然后将文本是否包含某类别标签这一事件和文本与该类别的相关度关联起来,文本与该类别相关度视作特征项与该类别相关度的集聚,其相关度越大,文本包含该类别标签的概率也越大,统计文本各类别相关度的贡献率,根据最大后验概率准则推理文本类别标签集合.在3个多标签分类常用评测指标下的实验结果表明:与MLKNN方法进行对比,对于机械制造领域文本,融合领域知识的多标签分类方法具有更好的分类性能.
机械制造领域、领域知识、相关度、多标签、文本分类
38
TP391.1(计算技术、计算机技术)
国家科技重大专项:汉川机床采用国产数控系统加工大型机床零件应用示范工程2012ZX04011-011
2016-05-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
10-13,23