10.3321/j.issn:0372-2112.2009.z1.005
代码与文档间关联关系的提取方法研究和改进
在潜在语义模型的基础上融入了软件文档和程序代码的特点,提出了基于类继承关系的代码聚类、代码特征项分类加权、引入相似度词典以及基于文档类型的分类搜索这四种改进策略.实验结果表明,四种策略可以在保持查全率不变的情况下提高查准率15%左右.表明在提取代码与文档问可跟踪性链时,考虑它们的固有特点,将有助于提高检索系统的查全率和查准率.
信息检索、可跟踪性链、程序理解、逆向工程
37
TP311.5(计算技术、计算机技术)
国家863项目2006AA01Z176;国家自然科学基金90718018
2009-06-05(万方平台首次上网日期,不代表论文的发表时间)
共9页
22-30