特征驱动的关键词提取算法综述
面向文本的关键词自动提取一直以来是自然语言处理领域的一个关键基础问题和研究热点.特别是,随着当前对文本数据应用需求的不断增加,使得关键词提取技术进一步得到研究者的广泛关注.尽管近年来关键词提取技术得到长足的发展,但提取结果目前还远未取得令人满意的效果.为了促进关键词提取问题的解决,对近年来国内、外学者在该研究领域取得的成果进行了系统总结,具体包括候选关键词生成、特征工程和关键词提取3个主要步骤,并对未来可能的研究方向进行了探讨和展望.不同于围绕提取方法进行总结的综述文献,主要围绕着各种方法使用的特征信息归纳总结现有成果,这种从特征驱动的视角考察现有研究成果的方式有助于综合利用现有特征或提出新特征,进而提出更有效的关键词提取方法.
关键词提取、候选关键词生成、特征、有监督方法、图方法
29
TP391(计算技术、计算机技术)
国家自然科学基金U1533104,U1633110,61603028;中央高校基本科研业务费ZXH2012P009
2018-08-16(万方平台首次上网日期,不代表论文的发表时间)
共25页
2046-2070