10.3969/j.issn.2095-2163.2021.11.042
基于KD树的k-means聚类算法优化
作为模式识别最基本的分类方法之一,聚类在各个科学领域的数据分析中都扮演着重要的角色.然而随着大数据的出现,聚类分析在前沿发展中不断地面临着计算复杂度和计算成本等新的问题和挑战.通过研究k-means聚类算法的时间复杂度O(nk),针对迭代过程中大量的最近邻计算和其特殊场景,引入KD树作为索引,提出了基于单KD树的近似近邻算法和基于多KD树的交叉搜索算法.将k-means聚类算法的时间复杂度降为O(nlog k),并通过实验验证,基于多树的交叉搜索算法具有与k-means聚类算法相当的聚类质量.
聚类分析;k-means聚类;KD树;近似近邻
11
TP301.6(计算技术、计算机技术)
2022-01-05(万方平台首次上网日期,不代表论文的发表时间)
共4页
194-196,封3