学位专题

目录>
<

基于核极限学习机自编码器的多标记学习

李存志
安庆师范大学
引用
最初,多标记学习是为了解决文档分类过程中遇到的语义分歧问题,自提出以来已逐渐成为数据挖掘和信息检索中的重要主题。现实生活中遇到的很多分类问题都和多标记相关,多标记学习的主要特征是增加了样本分类的种类,从之前的单一标记变成了多个标记,使得对样本的描述更加准确。在多标记学习中,样本空间有限信息的有效利用一直是许多学者的研究方向,为了提升算法的健壮性以及提取数据特征的效率,许多学者都在不同方面做了新的优化建议。研究表明特征重构在一定程度上能够提升算法性能,故将特征空间和标记空间信息结合统一。针对传统自编码神经拥有层级较为复杂计算过程,使得算法时间复杂度相对较大,引入了核极限自编码器。在现实世界中,标记之间往往存在一定的隐含关系,对标记之间的关系进行分析也是多标记学习研究的热点。基于此,本文展开研究,主要工作如下:  (1)多标记学习算法的重难点是如何准确获取到各组待训练的样本标记信息之间存在的关系,在此基础上去得到未知数据集合的预测结果,简单来说就是借助已有数据集合提取数据关联关系,进行推算得到预测结果。考虑特征与标记联合重构的特征能够提升算法的分类性能,提出一种核极限学习自编码算法(ML-KELMAE)。本文采用一种核极限学习机自编码神经网络,首先在神经网络输入节点中加入标记信息,然后使用核极限学习机自编码神经网络把输入特征作为目标输出,最后采用奇异值分解解决分类问题。在多个多标记基准数据集上的结果显示,该方法具有一定的优势。  (2)在现实世界中,标记集合中的个体与个体之间往往存在着一定的隐含关系,他们之间的这种关系对分类结果或多或少都有一定影响。因此,在进行算法分类时把关联关系因素加入到考虑中是十分有必要的。故在ML-KELMAE算法的基础上加入标记相关性因素,在原始标记矩阵中加入标记相关性信息,得到的矩阵代替原始矩阵。在算法对标记相关性特性进行优化的基础之上,加入了标记与特征相关因素的考虑。在本文选定的测试集上进行了测试,实验结果证明了加入标记相关性提升算法性能的合理性和有效性。

多标记学习;特征重构;核极限学习机;自编码器

安庆师范大学

硕士

统计信息技术

钱萌

2020

中文

TP181

2022-01-10(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅