10.3969/j.issn.1000-386x.2020.09.037
一种面向S NP选择的K-Center算法
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)数据是一种关于遗传病理学研究的重要数据,其高维少样本,存在大量噪声和冗余,并且SNP位点之间存在连锁不平衡性,因此需要对SNP数据进行降维.提出一种改进的K-Center算法——K-MSU算法.使用K-Center进行数据降维,在K-Center算法的距离度量中引入对称不确定性,解决SNP数据之间的连锁不平衡性;针对K-Center算法的随机选择初始聚类中心的方法容易对聚类结果产生较大的影响,使用基于信息增益的密度方法去选择初始聚类中心.在医院提供的临床实验数据的实验结果表明,K-MSU算法在SNP选择中具有更高的分类准确率和较好的效果.
单核苷酸多态、SNP、选择、K-Center、特征选择、对称不确定性、信息增益
37
TP3(计算技术、计算机技术)
江苏省重点研发计划社会发展项目;无锡市卫生计生委科研项目
2020-09-17(万方平台首次上网日期,不代表论文的发表时间)
共8页
227-234