10.3969/j.issn.1000-386X.2009.03.038
一种可行的Web数据抽取包装器的设计方法
Web包装器是根据特定的抽取规则从特定的Web数据源执行数据抽取程序,设计Web包装器是Web信息抽取和集成的关键技术.针对网页结构的不确定性和易变性,详细阐述了一种基于预定义模式的Web包装器的设计与实现过程,并选取了几个出版社的新书发布Web页面进行了数据抽取验证和抽取结果分析,取得了较好的效果.充分体现了此Web包装器的可行性,并具有一定的高效性及可维护性,能够应用在基于Wrapper/Mediator方法的Web数据集成.
包装器、抽取规则、信息抽取、Web数据集成
26
TP3;G4
河南省自然科学基金资助项目0411010500
2009-04-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
110-113