10.3969/j.issn.1000-386X.2007.12.027
一种无改写的正则表达式分析树构造算法
数据抽取常用正则表达式(RE)来描述数据源.为实现可视化描述,需将RE转换成分析树.但现有基于改写的RE分析树构造方法会破坏数据对象的内在结构,不能用于数据抽取问题.提出了一种无改写的RE分析树构造算法.实验表明,该算法在时空间性能和实用性等方面优于现有RE分析树构造算法.
正则表达式、分析树、数据抽取、改写
24
TP3(计算技术、计算机技术)
浙江省教育厅资助项目20060144
2008-03-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
65-66,84