10.3969/j.issn.1000-386x.2016.05.018
无监督实体关系触发词词典自动构建
传统的实体关系触发词词典构建主要采用人工方法和有监督的扩展学习方法。但是,上述两种方法都需要大量的人工参与,并且当关系类型发生变化时需要重新构建触发词词典。提出一种无监督的实体关系触发词词典自动构建方法。首先,对关系实例文档集进行分层狄利克雷过程建模,通过主题过滤和词语概率权重过滤构建候选触发词集合;然后,利用依存句法分析对候选触发词集合进行再次过滤以得到最终的触发词词典。该方法有效避免了传统实体关系触发词词典构建所需的大量人工参与。实验表明,基于分层狄利克雷过程和依存句法分析的实体关系触发词词典自动构建方法有效降低了人工标注成本,取得了较高的准确率。
实体关系触发词词典、分层狄利克雷过程、依存句法分析
33
TP391(计算技术、计算机技术)
国家高技术研究发展计划项目2011AA 7032030D;全军军事研究生课题军事学YJS1062。
2016-06-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
72-76