学位专题

目录>
<

基于文本数据的水旱灾害风险评估--以河南省为例

黄锦涛
华北水利水电大学
引用
随着全球变暖趋势加剧,水文与气象生态的变化愈加强烈,导致全球水旱灾害发生频率增加、强度加重,对人类社会和生态环境造成的负面影响愈加严重。本文以河南省作为研究区域,使用记载水旱灾害的史料文本数据,运用文本分析与自然语言处理(NLP)等方法,分析了河南省水旱灾害时间跨度长达近四千年的时间规律、河南省县级维度下的空间规律,并构建水旱灾害风险评估模型与指标体系,得到河南省地级维度水旱灾害风险等级。主要研究内容包括:  (1)基于潜狄利克雷主题模型分析水旱灾害时间规律  首先需对水旱史料文本数据分词与语义检索,构建了各类词典。包括停止词词典、水旱灾害专有名词词典、古今地名对应词典与水旱灾害等级描述词典等。其次利用以主题模型为主,词频分析与共词分析为辅的方法确定各灾害年主要灾害等级,构建了灾害等级时间序列,分析水旱灾害时间规律。以河南省为例研究结果表明:河南省从公元前1804年—2018年的3804年间,有939年出现了不同程度的旱灾,干旱发生频率约四至五年一次;有690年出现了不同程度的洪灾,洪灾发生频率约五至六年一次。  (2)基于语义描述与滑动窗口相结合的方法分析水旱灾害空间规律  为了分析水旱灾害的空间分布,设计将语义描述与滑动窗口匹配结合的方式,确定各县级市水旱灾害发生频数,形成了水旱灾害频率空间分布图。以河南省为例研究结果表明:河南省西北地区干旱发生的频数大于东南地区。洪涝灾害在全省普遍发生,北部区域发生洪涝灾害频数大于南部区域。  (3)构建水旱灾害风险评估模型评估水旱灾害风险  为了评估未来一年的水旱灾害发生风险,结合滑动平均法与正态分布得到时间维度下水旱灾害发生的概率,借助大数定律频率近似概率得到空间维度下县级水旱灾害发生的概率,二者结合构建水旱灾害风险评估模型。结果表明:河南省干旱灾害中高风险区集中在西北部,洪涝灾害中高风险区集中在西南部。通过实际灾情和与其他数据源得到的水旱灾害分析结果对比,验证研究成果。实际情况为2019年河南省4至6月发生干旱,洛阳和三门峡等地旱情突出,信阳市发生洪涝灾害,从而证明了研究结果的正确性。

自然语言处理;水旱灾害;文本数据;文本分析;风险评估

华北水利水电大学

硕士

计算机应用技术

刘雪梅

2020

中文

TP391.1

2020-12-14(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅