10.3969/j.issn.1000-386x.2019.03.051
K-means聚类算法在肿瘤基因变异识别中的应用
二代测序NGS(Next-generation sequencing)数据的迅速发展加快人们对于基因的探索,同时也给测序数据分析任务带来更大的挑战.癌细胞特异变异的识别是测序数据分析的一项重要基础性工作.当前的变异识别工具大多采用贝叶斯模型方法,特异度、灵敏度和速度都远远满足不了需求.K-means是一种简洁高效的无监督聚类算法,基于此将位点信息映射成多维的特征,再进行类别个数为2的聚类过程.该算法明显提高了准确度和召回率,实验结果验证了算法的有效性.
K-means、变异识别、二代测序
36
TP3(计算技术、计算机技术)
2019-06-06(万方平台首次上网日期,不代表论文的发表时间)
共5页
287-290,333