学位专题

目录>
<

高光谱结合机器学习的岩性识别方法研究

仝容超
西安石油大学
引用
岩性识别是石油勘探和开发领域中的一个重要环节,建立一种效率高、性能好的岩性识别模型具有重要意义。但进行岩性识别时面临诸多难题:地质岩性信息复杂,岩样信息采集干扰因素多,岩样信息分析专业性强,传统的岩性识别方法还存在效率低、准确率低和稳定性差等问题。  高光谱检测技术效率高、速度快、操作简便、无污染,广泛应用于环境、地质、化工等多个领域。应用高光谱检测技术进行岩性分析的关键是找到合适的数据处理方法,建立精准的识别模型。但是,常规数据处理方法局部差异不易放大、特征提取能力不足;传统建模方法适用性差、专业要求高。因此,将高光谱分析和机器学习算法结合,提出了一种岩性的快速识别方法,在此基础上加入数据预处理和降维方法,从不同方面着手致力于进一步提升模型性能。主要研究内容和结论如下:  (1)以蓝田县灞河地区为第一研究区采集同一取心井致密砂岩储层不同深度砂岩4类,以滨海新区大港地区为第二研究区采集不同探井典型沉积岩4类,采集研究区砂岩、泥岩、灰岩和页岩4类岩心共计962个样本的高光谱数据,并求得对应的反射高光谱数据。分析得到了4类岩样的反射高光谱特征及对应特征的影响机理。其中,岩样在1400nm波段之前的吸收谷特征与岩样物质成分中的Fe2+、Fe3+离子发生电子的能级跃迁有关。1400nm以后波段的吸收谷特征与岩样中CO32-、OH-基团弯曲或伸缩振动跃迁有关,也与岩样中含有的水分子有关。其中,2200nm附近出现的较为明显的特征峰,是受岩样物质成分中Al-OH和Mg-OH晶格振动的影响。针对上述岩样反射高光谱特征及影响机理,分析得出4类典型沉积岩的反射高光谱特征差异。  (2)针对岩石高光谱数据存在噪声干扰和异物同谱的问题,选取岩样在1800-2400nm波段范围内的反射高光谱曲线,采用Savitzky-Golay卷积平滑(SG)、多元散射校正(MSC)以及标准正态变量变换(SNV)3种数据预处理方法消除干扰,进一步提升模型识别准确率。建立的极限学习机(ELM)、概率神经网络(PNN)和支持向量机(SVM)模型中,采用SNV的高光谱数据预处理方法效果最佳,可以有效消除本底噪声,放大同类岩样高光谱局部差异,外部测试集模型准确率分别提升了12.50%、11.25%和12.50%。  (3)针对岩石高光谱检测效率低、准确率低的问题,采用主成分分析(PCA)、竞争自适应加权采样法(CARS)以及连续投影算法(SPA)3种特征提取方法对岩样特征高光谱变量进行提取。将提取的特征变量送入基于全波谱的SVM外部测试集模型,3种特征提取方法对模型性能提升效果由大到小排序为:SPA>CARS>PCA,准确率分别提升了8.33%、10.42%和12.50%。其中采用SPA的方法模型摒弃了大量冗余的信息,有效地提取了数据中的关键信息,提高了模型运算效率和准确率。  (4)针对岩样高光谱数据训练样本少的问题,在数据处理方法的基础上,建立了基于全波谱的SVM岩样高光谱数据识别模型,同时构建了ELM和PNN模型用于性能对比。其中,SVM模型更适合处理复杂数据和小样本数据,训练集和测试集的准确率分别为96.55%和100%,Kappa系数分别为0.9941和0.9792;ELM和PNN模型测试集的准确率均为95.83%,Kappa系数分别为0.9199和0.9255。研究至此,得到岩性识别的最佳组合模型为SNV-SPA-SVM,提取的特征变量个数为9,测试集准确率为100%。  研究方法和结论表明,高光谱检测技术与机器学习算法的成功结合简便易用,可以对不同种类岩样进行快速、准确的识别,在油气田勘探和开发中具有广阔的应用前景。

岩性识别;高光谱检测技术;机器学习;支持向量机;特征分析

西安石油大学

硕士

化学工程

焦龙

2023

中文

P585

2023-08-28(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅