10.16810/j.cnki.1672-514X.2020.05.015
《科学数据管理办法》语词分析
文章分析了《科学数据管理办法》的文本语词,有助于把握国家对科学数据管理的政策导向.文章对《科学数据管理办法》的文本内容进行分词、词频合并、词性筛选、虚词剔除等预处理操作,基于文本预处理结果筛选得出频繁词和热词,构建"语词—条款"共现矩阵并可视化展示.研究发现:《科学数据管理办法》共有11个核心频繁词、9个重点频繁词、8个主要频繁词和若干个一般频繁词,各主题语词在文本中均有对应的核心条款,但主题语词和核心条款分布不均.
《科学数据管理办法》、自然语言处理、词频统计、关联分析
G322.0(世界各国科学研究事业)
本文系国家自然科学基金重大研究计划培育项目"面向管理和决策的大数据资源共享与治理机制";中国科学院战略性先导科技专项A类子课题"大数据资源库与门户系统"
2020-07-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
81-89