期刊专题

10.13266/j.issn.0252-3116.2016.02.019

基于条件随机场的学术期刊中理论的自动识别方法

引用
[目的/意义]从学术期刊中抽取其中的理论是对文献进行内容分析的前提,实现理论名称识别的自动化可以提高内容分析的效率.[方法/过程]将理论识别视为一类命名实体识别问题,总结现有的命名实体识别的常用方法,提出一个基于语义泛化思想的命名实体识别方法,选取词性、知网义原等外部知识,采用CRF模型对《情报学报》1 822篇论文的标题和摘要进行实验.[结果/结论]实验表明,识别准确率最高达到95.38%,但召回率较低;训练语料规模对性能影响较大,不同程度的语义泛化方法对准确率和召回率有复杂影响.如何选择语义特征、语义标注和语义消歧是需要解决的新问题.

理论识别、命名实体识别、引文分析、语义泛化

G356.9(情报学、情报工作)

本文系国家社会科学基金重大项目“我国网络社会治理研究”项目编号:14ZDA063研究成果之一.

2016-04-15(万方平台首次上网日期,不代表论文的发表时间)

122-128

相关文献
评论
暂无封面信息
查看本期封面目录

图书情报工作

0252-3116

11-1541/G2

2016,(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅