学位专题

目录>
<

面向区间值数据的特征选择算法研究

陈婷
华东交通大学
引用
特征选择是粗糙集知识约简的重要策略。区间值数据作为单值的扩展,可以从不确定性度量的角度更好地表达不确定信息。但是,在现实世界中的应用,区间值数据中的特征值会随着时间的变化而变化。对于动态区间值数据来说,采用现有方法来选择特征子集非常耗时,因为当特征值变化时,它们需要从头开始重新计算区间值数据。为此,我们研究了动态区间值数据环境下特征选择的增量方法,该方法可以根据先前的结果选择新的特征子集。根据不同的动态变化情况,分别介绍了相应的增量更新机制,最后,通过比较增量算法和非增量算法在个公共数据集上的特征子集选择结果,可以得出结论,所提出的两种增量算法更高效,特别是出现多个对象同时改变特征值的情况时,文中提出的增量式特征选择算法在运行效率上取得了令人满意的结果。本文主要研究工作如下:  (1)针对区间值决策系统中对象的特征值的动态更新,研究了局部特征值的更新情况,构造了基于θ-条件熵的增量更新机制。鉴于此,根据区间值决策系统出现的两种特征值变化问题——单个对象的特征值动态变化和多个对象下特征值同时发生动态变化,首先利用区间值数据的相似度构造了θ-相似类,然后基于改进的θ-条件熵,联合局部更新策略设计了增量式特征选择算法。最后,在公开的UCI数据集上进行了一系列的静态和动态的对比实验,最终实验结果验证了所提算法的有效性和高效性,且多个特征值变化下的增量特征选择算法更具有优越性。  (2)针对区间值决策系统中特征集的动态变化,研究了局部特征集的变化情况,构造了基于θ-区分度的增量更新机制。鉴于此,根据区间值决策系统出现的动态变化问题——特征集的增加和删除,首先在特征集增加和删除的情况下,分别分析了θ-区分度的局部更新机制,然后联合前向搜索策略设计了增量式特征选择算法。最后,在公开的UCI数据集上与其他4个不同的特征选择算法进行了一系列的对比实验验证,最终实验结果证明了所提算法在提升效率上具有突出优势。

区间值数据;特征选择;粗糙集;增量学习;条件熵

华东交通大学

硕士

计算机技术

舒文豪

2023

中文

O235

2023-11-30(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅