10.3969/j.issn.1003-6059.2006.03.002
一种有效的高属性维稀疏数据聚类算法
聚类分析是数据挖掘最常见的技术之一,数据的规模、维数和稀疏性都是制约聚类分析的不同方面.本文提出一种有效的高属性维稀疏数据聚类方法.给出稀疏相似度、等价关系的相似度、广义的等价关系的定义.基于对象间的稀疏相似度和等价关系原理形成初始等价类,通过等价关系的相似度修正初始等价关系,使得最终聚类结果更合理.该算法聚类过程不依赖于输入样本的排列顺序,高维稀疏数据的有效压缩提高算法在维数较高时的执行效率,适合于高维稀疏数据的聚类分析.
稀疏相似度、等价关系的相似度、数据压缩、聚类
19
TP18(自动化基础理论)
江苏省自然科学基金资助项目BK2004137
2009-08-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
289-294