10.3969/j.issn.1001-2400.2018.04.019
面向工业大数据的多层增量特征提取方法
针对工业大数据中高维小样本情况导致增量线性判别分析失效问题,提出了一种面向工业大数据的多层增量特征提取方法,对高维小样本数据进行有效降维,并最大限度保留样本的变异信息和判别信息.首先,利用滑动窗口增量实时更新数据流,检测和过滤离群点,基于增量主成分分析对数据进行初步特征提取,利用Fisher准则函数量化各主元所包含的分类信息;然后,采用熵值法确定各主元贡献率和识别能力的权重,对主元进行筛选,由筛选出的主元构成新的特征空间;最后,将当前窗口的高维数据通过增量线性判别分析投影,完成二次特征提取的同时确定样本类别.实验结果表明,该方法可有效提取实时数据特征,同时很好地保留其判别能力.
工业大数据、高维小样本、特征提取、增量线性判别分析、增量主成分分析、熵值法
45
TP391(计算技术、计算机技术)
陕西省国际科技合作与交流计划资助项目2016KW-048,BD18016040001
2018-08-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
106-111