10.3969/j.issn.1000-386x.2014.06.042
一种基于划分的混合数据聚类算法
在实际应用领域,常常存在同时包含数值型和分类型特征的混合数据.然而,已有的大多数聚类算法只能处理数值型或分类型单一类型数据,因此,提出一个基于划分的混合数据聚类算法.首先给出K-Prototypes算法中分类型数据类中心的多Modes表示方式,进而将传统的欧式距离扩展到混合数据,使之能够在相同框架下更加精确地反映对象与类之间的相异性,在此基础上提出一个用于处理混合数据的划分式聚类算法.最后,在UCI数据集上的实验结果表明,与K-Prototypes算法相比,所提出的算法能够有效提高聚类质量.
K-Prototypes算法、混合数据、划分聚类、相异性度量
31
TP18(自动化基础理论)
山西省自然科学基金项目2012011014-2
2014-08-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
154-157