10.3969/j.issn.1000-386x.2014.04.010
基于改进遗传退火HMM的Web信息抽取研究
为进一步提高 Web 信息抽取的准确率,针对隐马尔可夫模型 HMM(Hidden Markov Model)及混合法在参数寻优上的不足,提出一种改进遗传退火 HMM的 Web 抽取算法。构建一个后向依赖假设的 HMM;用改进遗传退火优化 HMM参数,将遗传算子和模拟退火 SA(simulated annealing)参数改进后,据 GA(genetic algorithm)的自适应交叉、变异概率给子群体分类,实现多种群并行搜索和信息交换,以避免早熟,加速收敛;并将 SA 作为 GA 算子,加强局部寻优能力;最后,用双序 Viterbi 解码,与现有 HMM优化法相比,实验的综合 Fβ=1平均提高了6%,表明改进算法能有效提高抽取准确率和寻优性能。
信息抽取、遗传退火、隐马尔可夫模型、Viterbi 算法
TP391(计算技术、计算机技术)
国家自然科学基金项目601003247;山西省高校科技开发项目20101120,2013147;忻州师院重点学科建设项目ZDXK201204。
2014-05-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
40-44