10.3969/j.issn.1000-386x.2015.06.016
基于 Lingpipe 的煤炭领域科研信息监测分析平台设计与实现
针对网络环境下文本挖掘技术在煤炭领域科研信息监测分析平台中的应用,首先对基于 Web 方式的文本挖掘开源工具比较分析,然后利用开源工具从基本特征提取、主题词抽取、自动分类和主题聚类等几个环节展开应用,最后利用 TF-IDF 算法实现煤炭领域热点主题趋势对比分析,为准确把握煤炭领域热点动态信息提供参考依据。
Carrot2、Lingpipe、Mahout、自动分类、主题聚类
TP301(计算技术、计算机技术)
中国科学院战略性先导科技专项基金项目XDA07080205。
2015-07-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
66-71,103