期刊专题

10.3969/j.issn.1002-1965.2019.10.024

基于深度迁移学习的技术术语识别——以数控系统领域为例

引用
新兴术语识别是新兴技术预见的一项重要工作,专利文献是技术情报的最新来源,被广泛地用于新兴技术预见.专利文献易于使用,但是术语难以挖掘、抽取难度大,存在缺乏术语标签的问题,目前未发现针对专利文献运用命名实体识别(NER)抽取技术术语的研究. [方法/过程]该文引入深度迁移学习的思想,利用成熟的公共领域源数据,运用Bi-LSTM(双向长短时记忆)模型实现跨领域迁移,有效识别技术术语并过滤高频非术语词串,通过聚类对识别术语划分技术类别. [结果/结论]以数控系统(CNC)领域专利文献为例,模型有效地将公共领域源数据已有知识迁移到科学领域目标数据,解决了专利文献少标注的问题,识别术语领域相关性强.以此划分的技术类别能为领域技术发展趋势研究提供数据支持.

新兴技术预见、命名实体识别、深度迁移学习、数控系统、专利分析

38

G306.0(科学研究理论)

国家自然科学基金项目"支持技术预见的多源异构大数据融合与时序文本预测方法研究"91646102;国家自然科学基金项目"面向2035的高端装备领域技术路线图总体框架及重点子领域研究"L1824039;国家自然科学基金项目"衍化升级情境下2035智能制造领域技术路线图应用研究:基于融合与派生路径"L172400022;教育部人文社会科学项目16JDGC011;中国工程科技知识中心建设项目"工程科技战略咨询智能支持系统建设"CKCEST-2019-2-13

2019-10-24(万方平台首次上网日期,不代表论文的发表时间)

共8页

168-175

相关文献
评论
暂无封面信息
查看本期封面目录

情报杂志

1002-1965

61-1167/G3

38

2019,38(10)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅