10.3969/j.issn.1000-386x.2014.11.027
基于多特征的中文关键词抽取方法
关键词抽取是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在分析传统中文关键词抽取方法不足的基础上,提出一种基于多特征的中文关键词提取方法。该方法在抽取中文关键词过程中,从词频、关联度、词性以及位置等多种特征来全面考查关键词,有效地避免了传统关键词提取方法产生的偏差。实验结果表明,与传统方法相比,该方法在不同测试集上关键词提取的平均召回率均得到明显提升。
抽取、词频、关联度、文本聚类
TP391.1(计算技术、计算机技术)
四川省教育厅2010年青年基金项目10ZC102。
2014-12-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
109-112