基于序列到隐写序列的约束型自然语言信息隐藏方法
已有的基于文本生成的无约束型自然语言信息隐藏方法主要利用不同的文本生成模型在秘密信息的控制下实现隐写文本的生成,它们生成的隐写文本质量较好且嵌入容量高.但这些方法大都局限于生成短隐写文本,整体的文本质量和句间语义相关性会随着句子长度增加而急剧下降.与无约束型方法不同,已有的约束型自然语言信息隐藏方法能针对特定场景实现长文本生成任务下的信息隐藏,具有更高的语言隐蔽性和安全性.为提高约束型方法面对各类应用场景的普适性,本文提出了一种通用的序列到隐写序列模型框架,该框架包含语言编码器和隐写器两部分,能实现从一种约束信息序列到另一种隐写文本序列的变换.以摘要生成为例,本文以序列到隐写序列模型为基本框架,提出了一种新颖的约束型自然语言信息隐藏方法.该方法在语言编码器中引入注意力优化单元以提升特征学习性能,在隐写器中融合复制机制和新设计的基于多候选优化的自适应隐写编码方法,使得隐写器可以根据候选单词序列的概率分布情况和待嵌入的秘密信息自适应地选择不同的输出优化策略,通过输出多个候选序列以及仅在嵌入时刻选择合适位置嵌入信息的方式来提高隐写文本质量.实验结果表明,本文提出的方法能够通过优化语言编码器和隐写器的设计,提高隐写摘要文本与原始摘要文本的语义相似度以及隐写摘要文本的质量,其质量甚至还优于基于基础语言编码器生成的正常摘要文本的质量,具有极强的隐蔽性.此外,本文方法生成的隐写摘要文本安全性高,利用多种隐写分析方法进行检测的各项指标基本低于60%,难以从正常文本中识别出本文方法生成的隐写摘要文本.
自然语言信息隐藏、文本生成、约束型自然语言隐藏、序列到隐写序列、隐写编码
46
TP309(计算技术、计算机技术)
2023-08-18(万方平台首次上网日期,不代表论文的发表时间)
共20页
1650-1669