10.3969/j.issn.1000-386x.2020.02.002
基于代码克隆检测的代码来源分析方法
随着软件生态系统和开源社区的发展,代码常在多个软件系统中复制、传播和演化,给软件系统带来了软件质量的不确定性和风险,因此,高效地查找软件系统代码可能的来源是当前研究的热点之一.提出一种基于代码克隆检测的代码来源分析方法,将目标软件代码以方法为单位切割为代码片段,转换为词袋后,在大规模代码资源库中进行并行化代码克隆检测,从而实现方法粒度的代码来源分析.基于该方法,设计并实现了一个代码来源分析工具.该工具能自动分析被测软件项目代码与代码资源库中多个项目以及版本之间的可能来源.实验结果表明,该系统能够有效地找出目标项目在大规模代码库中的代码来源信息,辅助软件维护人员理解和维护代码.
代码来源分析、Hash、词袋模型、代码克隆、克隆检测
37
TP3(计算技术、计算机技术)
上海市科技发展基金项目16JC1400801
2020-03-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
8-14