10.19665/j.issn1001-2400.2021.06.004
增强型深度对抗样本攻击防御算法
当前,深度学习在各种应用领域已取得了巨大的成功,但深度神经网络模型的鲁棒性和性能极易受到带有细微扰动的对抗样本的攻击.针对现有对抗样本去噪防御算法破坏干净样本的有用信息致使模型分类精度下降的缺陷,基于在目标模型上添加增强型输入去噪器,以及基于凸包理论所提出的隐层干净样本有损信息恢复器,提出了一种新的增强型对抗样本攻击防御算法.该算法首先在模型的输入层训练一个去噪器,去噪器的输入为干净样本和对抗样本的并集,期望去噪器去除对抗扰动的同时避免对干净样本的遗忘.其次,考虑到去噪器会破坏干净样本含有的扰动信息,故而在模型的隐层中训练一个恢复器,恢复器的输入为干净样本和对抗样本隐向量的凸组合,期望恢复器将位于错误分类空间的样本重新映射回正确分类空间,以此训练出更具鲁棒性的模型.在多个标准数据集上的大量对比仿真实验表明:所提出的去噪器和恢复器能有效地提升模型的鲁棒性,其对抗样本防御性能优于众多现有代表性的对抗样本防御算法.
深度学习、对抗样本、输入去噪器、隐层信息恢复器
48
TP183(自动化基础理论)
国家自然科学基金61472296
2022-04-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
23-31