学位专题

目录>
<

基于群体关注度的开源软件检索技术研究

湛云
国防科学技术大学
引用
随着计算机技术的发展,尤其是互联网技术和相关企业的兴起,开源软件在操作系统、分布式处理、机器学习、编译工具链、数据库等各个方面已经成为主流。因此开源软件受到越来越多的人关注、参与和使用。  开源软件的快速发展,也让开源资源定位面临越来越大的挑战。开源软件数量急剧增长且分散在各个开源社区,且相似功能开源软件数量众多,质量参差不齐,寻求开源软件资源的用户难以高效、准确定位满足自身需求且高质量的资源。开源软件的海量性和复杂性使得传统的资源定位、信息检索技术在实际过程中的效果不理想,如何高效的帮助用户找到优秀开源软件面临巨大挑战。学术界关于软件资源定位的研究大多关注代码资源的定位,工业界现有的系统都提供了软件资源的检索机制,但大多仅仅按照文本关联度、开发者行为数据等单一维度对检索结果排序,难免造成检索失败或检索效果不理想,增加了寻求资源的用户的时间成本。  开源社区的不断繁荣,使得互联网中形成了包涵面向开发者的协同开发社区和面向用户的知识分享社区,这两类社区相互关联,相互补充。本文基于协同开发社区和知识分享社区的关联性,研究基于文本的开源软件群体关注的自动聚合技术,构建知识分享社区中的各类群体关注文档与开源软件的关联,并基于该关联网络进一步分析和挖掘,形成了开源软件信息知识库,量化了开源软件群体关注度,提出了基于群体关注度的开源软件检索优化方法。本文以设计并实现高效的基于群体关注度的开源软件检索方法与系统为研究目标,围绕基于文本的开源软件群体关注自动聚合技术和基于群体关注度的开源软件检索优化方法两个研究内容,构建了基于群体关注度的开源软件检索系统,并将该检索系统上线到开源大数据服务平台OSSEAN,围绕在线系统,构建了可靠测试集,有效检验了基于群体关注度的开源软件检索优化方法。

开源软件;检索系统;排序技术;群体关注度;开发者行为

国防科学技术大学

硕士

软件工程

王怀民

2016

中文

TP311.52

2019-01-18(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅