学位专题

<
DOI:10.7666/d.Y1919398

基于知网和贝叶斯模型的词义消歧技术的研究

徐赟
南京理工大学
引用
词义消歧是自然语言处理中的热点和难点问题,对机器翻译、信息检索、句法分析及文本分类方面的研究,有着极其重要的理论及实践意义。现阶段词义消歧技术,因为词义知识获取中的瓶颈因素、词义消歧知识库的质量及词义消歧模型的优劣问题,消歧正确率一直不太理想。因此,如何进一步提升词义消歧的处理效果,一直是科研人员在词义消歧领域研究的动力和目标。   本文首先简述了词义消歧主要研究方法,并对词义消歧主要技术进行评述。其次,介绍了词义消歧相关概念及《同义词词林》、《现代汉语语义词典》、知网等语义分类体系。然后,讨论了决策树与决策表、神经网络预测模型、最大熵方法、隐马尔可夫模型、贝叶斯模型等词义消歧相关模型。在此基础上,阐述基于知网和贝叶斯模型的词义消歧,阐述内容包括依存句法分析、基于知网和贝叶斯模型的词义消歧的体系结构、基于知网的词义消歧过程、贝叶斯模型的改进方法、基于知网和依存句法分析的贝叶斯推理、基于知网和贝叶斯模型词义消歧流程、基于知网和贝叶斯模型词义消歧算法以及模型训练与消岐示例。最后,进行词义消歧模型的实验测试和性能分析,内容包括实验用语料库、测试说明、实验结果、对比和分析。关于实验结果,包括神经网络预测模型的实验结果、隐马尔可夫模型的实验结果、贝叶斯模型的实验结果、基于知网和贝叶斯模型的实验结果;关于对比和分析,包括神经网络模型与贝叶斯网络模型的实验对照分析、隐马尔可夫模型与贝叶斯模型的实验对照分析、贝叶斯模型与基于知网和贝叶斯模型的实验对照分析。实验表明,笔者研究的基于知网和贝叶斯模型的词义消歧技术,在几种词义消歧模型中具有比较突出的优势。

词义消歧;贝叶斯模型;语言处理;信息检索

南京理工大学

硕士

模式识别与智能系统

肖亮

2010

中文

TP391.1

68

2011-10-31(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅