学位专题

<
DOI:10.7666/d.Y737162

化工类专业搜索引擎中的中文分词设计

王坚
北京化工大学
引用
本文中提出了一种基于常规最短路径方法的分词算法:层进式最短路径分词方法。使用该算法可以消除大量歧义,取得较好的分词效果。文中还详细介绍了整个分词模块的设计结构。包括分词用词典的结构设计实现,词典中包含有大量化工类专业词汇,可以用于优化针对化工专业的分词并实现了高效的词典查询算法;为避免相似功能的重复开发,实现代码重用的对象复用架构和基于该架构的线程池实现方案;组成分词模块的层次结构,其中使用了相关技术以优化分词的效率;分词算法的具体实现。实践证明该模块可为化工类专业搜索引擎提供良好的分词服务功能。

搜索引擎;信息查询;中文分词;分词效果

北京化工大学

硕士

计算机应用技术

赵恒永

2005

中文

TP393.092;TP391.1

44

2005-11-16(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅