10.3969/j.issn.1000-386X.2010.09.016
基于结构语义熵的网上商品信息提取系统
目前网上销售已成为一种重要的商品销售途径,其中商品网页信息提取是商品发布信息监测、商品比价等应用的技术基础.传统的网页信息提取系统在提取这些商品信息时存在人工干预过多和提取数据的针对性不强的问题.针对商品销售网站数据的具体表现形式,提出了一种基于结构语义熵的商品信息提取算法.该算法结合了商品的语义特征和网页的结构表现形式,可以实现全自动的网页商品提取.并通过实验证明了算法的有效性,和其在网上商品销售领域的普适性.
网页信息提取、结构语义熵、信息聚集度分析
27
TP3;G35
国家科技支撑计划项目2006bah02a05-06
2010-11-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
49-52,84