10.3969/j.issn.1000-386x.2017.02.007
基于改进的隐马尔可夫模型在网页信息抽取中的研究与应用
信息抽取是从大量的数据中准确、快速地获取目标信息,提高信息的利用率.考虑网页数据的特点,提出一种适用于网页信息抽取改进的隐马尔科夫模型(HMM),即结合最大熵模型(ME)在特征知识表示方面的优势,在HMM模型中加入后向依赖,利用发射单元特征来调整模型参数.改进后的HMM状态转移概率和观察输出概率不仅依赖于模型的当前状态值,而且可以以模型的前向状态值和后向特征值加以修正.实验结果表明,使用改进后的HMM模型应用到网页信息抽取中,可以有效地提高网页信息抽取的质量.
隐马尔可夫模型、最大熵模型、网页信息抽取
34
TP3(计算技术、计算机技术)
国家自然科学基金项目61502170
2017-05-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
42-47