学位专题

目录>
<

基于分类法自动映射的众包实现——以CLC与DDC、LCC化学类目映射为例

陈瑞
山西大学
引用
分类法作为重要的知识组织工具,在图书馆书目资源、文献资源按类组织、分类排架以及多种网络信息资源的导航和检索等方面发挥着重要作用。目前,不同国家地区,不同性质的机构采用不同的分类法标引各自的信息资源,不同分类系统之间未明确建立对应关系,从而影响了互访效率。随着图书馆之间馆际互借及其资源共享运动的推动,图书馆书目数据库之间的互访成为发展趋势。建立不同词表之间的映射是实现分类系统互操作的一种重要方法,对不同分类法之间的映射研究具有重要意义。  目前,国内外学术界针对分类法的映射做了积极地探索和实践,分类法映射模式分为人工映射和自动映射。人工映射的映射结果准确、完整,但是工作量大、完成周期长;自动映射提高了映射效率,仍存在结果不准确、有些类目无法建立映射等问题,无法实现完全自动映射。结合人工映射和自动映射的方式可以有效提高分类法映射的准确率和效率。众包是一种创新模式,利用计算机和用户的经验及知识来解决机器难以单独完成的任务。将众包引入分类法的映射实践,其实质是利用大众的知识背景和智慧完成映射工作,可以提高映射的准确性并发现更多的映射类目。  基于以上背景,本文提出基于分类法自动映射的众包实现方法,依据分类法特点构建自动映射模型,在自动映射结果的基础上,通过设计众包映射组织模式,最终实现分类法之间的匹配。本文首先对分类法映射基础理论、映射方法进行简要概述。选择CLC、DDC、LCC这三部世界范围内使用广泛的图书分类法,构建CLC与DDC、LCC两种国外分类法之间的映射。本文分析了三种分类法各自的特点,采用基于类目相似度的方法实现CLC与DDC类号映射,映射过程中对类目特征词进行词素切分。在CLC与LCC映射中,引入DDC与LCC的映射,提出基于关联书目数据的DDC与LCC映射实现,并且以DDC类表为中介,间接建立CLC与LCC之间部分类目的映射关系。之后以自动映射的结果为基础,通过设计众包分类法映射框架、众包映射任务模块、众包映射质量控制方案等构建众包分类法映射模式。最后,通过具体的应用实例验证该方法的准确性和有效性,为其他分类法的映射提供参考。

分类法;自动映射;众包实现;类目相似度

山西大学

硕士

情报学

贾君枝

2019

中文

G254.1

2020-01-15(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅