10.13266/j.issn.0252-3116.2023.12.010
数字人文视域下先秦典籍植物知识挖掘与组织研究
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义.[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式.[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法:所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现.
数字人文、先秦典籍、植物命名实体、深度学习、知识图谱
67
I206.2;TP391.1
国家社会科学基金;国家自然科学基金
2023-07-28(万方平台首次上网日期,不代表论文的发表时间)
共11页
103-113