10.3969/j.issn.1000-386x.2013.04.024
基于距离排序的快速支持向量机分类算法
传统支持向量机算法由于时空复杂度较高,因此很难有效地处理大规模数据.为了降低支持向量机算法的时空复杂度,提出一种基于距离排序的快速支持向量机分类算法.该算法首先计算两类样本点的样本中心,然后对每一个样本计算它与另一类样本中心之间的距离,最后根据距离排序选择一定比例的小距离样本作为边界样本.由于边界样本集合很好地包含了支持向量,而且数目较原始样本集合少得多,因此算法可以在保证支持向量机学习精度的前提下,有效地缩短训练时间和节约存储空间.在UCI标准数据集和20-Newsgroups文本分类数据集上的实验说明算法较以往支持向量预选取算法而言可以更为快速准确地进行支持向量预选取.
支持向量机、时空复杂度、大规模数据、距离排序
30
TP301(计算技术、计算机技术)
国家自然科学基金项目1072166;山西省自然科学基金项目2009011018-4
2013-05-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
85-87,100