10.3969/j.issn.2095-2163.2018.03.015
基于序列到序列模型的句子级复述生成
句子复述是指将一个句子换一种表达方式,意思与之前一样.复述在自然语言处理中应用广泛,例如被应用在信息检索、自动文摘、信息抽取、句子翻译等任务中.本文主要研究句子级复述生成的相关内容,首先尝试了基本seq2seq模型用于句子复述,并尝试在encoder阶段采用双向LSTM,而且在此基础上加入注意力机制,比较句子生成结果,可以得出加入注意力机制的模型生成的效果要好.此外本文提出复制机制和覆盖机制对模型进行改进,其中复制机制旨在解决原句中出现人名、地名等特殊词汇的情况,这样情况研究希望模型可以对词进行复制,不进行改变,实验结果证明,复制机制对这一情况有所改善,句子生成效果较好,最后,针对seq2seq普遍存在的重复问题,在复制机制的基础上加入覆盖机制,有效改善了生成句子的重复问题.对于模型生成结果,采用BLEU值进行评价.
句子复述生成、seq2seq模型、注意力机制、复制机制、覆盖机制
8
TP391.4(计算技术、计算机技术)
2018-07-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
61-63,69