10.3969/j.issn.1000-386X.2010.04.048
基于本体的旅游信息抽取
基于本体的信息抽取技术是一种把本体和信息处理技术结合起来实现信息抽取的一种方法.提出一种基于本体的旅游领域信息抽取方法.该方法依据旅游本体的关键词定位页面信息区域,从网页中抽取正文信息,对其进行分词处理及过滤,再根据Java标注模式引擎JAPE(Java Annotation Patterns Engine)编写的规则进行本体匹配,形成结构化的内容,存入数据库.最后,通过实验证明了所提出的方法的准确性.
本体、信息抽取、DOM树、旅游信息
27
TP3;TN9
广西青年科学基金项目0640030;广西科学研究与技术开发计划项目0719001-11
2010-05-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
146-148,161