10.3969/j.issn.2095-2163.2014.04.006
使用过训练提升词性标注依存句法联合模型的速度
词性标注和依存句法分析是自然语言处理领域中句子级别基本分析技术的两个重要任务,一般来说词性标注是依存句法分析的一个前提条件。基于联合分析的方法将这两个任务在一个统一的统计模型中联合处理能避免错误传播这类问题的发生,因此这种联合模型能取得比较好的性能。但是这种联合模型会带来算法上的时间复杂度的额外开销,因此导致联合分析的方法,速度非常慢。本文提出一种基于过训练的方法,通过极少量的性能损失,使得联合模型的解码速度提升了6倍。
词性标注、依存句法分析、联合模型、过训练
TP391(计算技术、计算机技术)
国家重点基础研究发展计划9732014CB340503;国家自然科学基金面上项目61133012,61370164。
2014-09-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
21-24