10.3969/j.issn.1000-386X.2009.04.024
Web表格信息抽取模型的设计与实现
Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中.现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自定义的启发式规则来抽取表格信息.实验结果表明该模型能够很好地应用于Web表格信息的抽取.
表格结构、抽取模型、启发式规则、预处理、解析
26
TP3;TN9
国家发改委基金项目SNMCFIP-2006 S001
2009-06-02(万方平台首次上网日期,不代表论文的发表时间)
共3页
72-74