DOI：10.3969/j.issn.1000-386x.2016.03.067

基于话题翻译模型的双语文本纠错

引用

摘要：

近年来，随着信息全球化的影响，社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的，并不能很好地处理多语言混合的文本，因此在进行其他自然语言处理任务之前对文本进行预处理显得尤为重要。面对网络文本语义空间双语对齐语料的匮乏，提出一种基于话题翻译模型的方法，利用不同语义空间的语料计算网络文本语义空间的双语对齐概率，再结合神经网络语言模型将网络混合文本中的英文翻译成对应中文。实验在人工标注的测试语料上进行，实验结果表明，通过不同的对比试验证明文中的方法是有效的，能提升翻译正确率。

关键词：网络文本、话题翻译模型、神经网络语言模型

所属期刊栏目：33

分类号：TP391(计算技术、计算机技术)

资助基金：陈欢，硕士，主研领域自然语言处理，机器学习。张奇，副教授。

在线出版日期：2016-05-04（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：284-287

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于话题翻译模型的双语文本纠错