10.3969/j.issn.0254-3087.2017.09.005
基于密度-距离的t混合模型流式数据聚类
传统流式数据采用人工设门法分析,效率低下且依赖于专家.近几年,很多自动流式数据聚类算法纷纷被提出,然而针对数据量不多且分布稀疏的小样本类群始终没有很好的解决办法.提出了一种基于密度-距离的t-混合模型流式数据聚类优化方法,能够较好地解决小样本类群区分困难的问题.该方法通过密度-距离中心算法定位各类群的初始中心,作为t-混合算法的初值对样本数据进行处理,通过最大似然估计求出各类群对应的样本数目,从而实现样本聚类.实验表明,与经典模型算法相比,基于密度-距离的t-混合模型优化算法具有更好的稳定性和可靠性,对小样本类群以及混叠的类群具有较强的适应能力.
t-混合模型、密度-距离中心算法、流式细胞分析术、聚类算法
38
TH-773;TP-391
上海市浦江人才计划17PJ1432300
2018-01-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
2130-2137