10.3969/j.issn.1000-386x.2013.08.005
基于树状语料库的中文短语相似度计算
在诸如文件摘要、个性化搜索、学术诚信检测、常见问题自动解答、自动翻译等领域,短语相似度计算是核心算法.通过引入树状语料库,精确定义、计算词汇相似度,对基于抽取关键词序列的中文短语相似度算法做进一步改进.实验证明,该方法在提高中文短语相似度计算的准确率上达到了预期效果,更符合人的直观感觉.
自然语言处理、文件摘要、中文短语相似度计算、树状语料库、关键词序列
30
TP391(计算技术、计算机技术)
国家自然科学基金项目61073186;中南大学米塔尔学生创新创业项目11MX07
2013-09-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
18-20,42