基于粒度的数据流不确定性信息处理

孔颖

重庆交通大学

下载全文

在线阅读

引用

摘要：

随着计算机网络、数据库、通信等技术的飞速发展，由此引发了信息数量的爆炸式增长，许多领域出现了高速产生、动态变化的流式数据，如交通监控和网络管理数据、电信记录、金融证券交易数据等，研究人员称这种类型的数据为数据流。相对传统类型的静态数据，数据流具有截然不同的特点:数据流实时非匀速到达，且到达次序独立，不受系统控制;数据持续到达，其数量不可预知;数据流原则上只被能访问一次或有限几次。因而，数据流应用对数据管理方案和分析技术提出了更高的要求。目前有关数据流的研究引起了诸多行业的深度关注，尤其是在工业领域和学术领域。就研究的内容与性质而言，可简单分为数据流挖掘与数据流管理系统两类。本文主要探讨数据流挖掘中的若干问题。　　不确定性是客观事物的一个固有特性，在现实世界中存在大量不确定性数据。不确定性知识发现的任务就是发现隐含在这些不确定数据中的信息，寻找并且能够形式化地表示不确定性中的规律。对数据流挖掘而言，从数据收集阶段、预处理阶段以至后续的数据挖掘及结果评估阶段，都存在大量的不确定性。　　粒度计算是一种新的智能信息处理技术，它包涵了与信息粒度相关的所有理论知识以及具体的实现方法。粒度计算利用分层递阶的思想来处理现实世界中不完整的(Incomplete)、不确定性的(Uncertain)以及不精确(Inaccuracy)的信息。其本质是通过学习并模拟人脑认识和解决现实问题的过程，利用分而治之思想降低原问题的复杂性，并运用启发式方法找到问题的近似解。虽然，利用粒度计算来处理问题，得到的往往是一种近似的结果，但这并不阻碍粒计算的运用与发展。因为现实世界中，对于很多问题并不需要追求精确的结果，只要满足一定准确度即可。　　本文在总结和分析国内外已有研究工作的成果与不足的基础上，借助粒度计算理论对数据流中的不确定性信息处理展开深入研究。利用粒度计算分而治之的思想，通过构建数据自驱动型动态粒度模型，降低数据流环境的复杂性，并借助云理论、模糊理论以及其他相关理论对数据流挖掘中有关使用粒度概念而导致的不确定性问题(包括数据流粒度建立过程中的不确定性、不同粒度转换过程中的不确定性以及粒度查询策略的不确定性等)进行定性定量的分析，进一步明确数据流挖掘过程中的不确定性因素，并对这些因素进行有效控制和处理，以更准确地发现隐含在数据流中的知识。

关键词：数据流;数据挖据;粒计算;动态粒度模型;信息处理

授予单位：重庆交通大学

授予学位：硕士

学科专业：计算机应用技术

导师姓名：朱振国

学位年度：2013

语种：中文

分类号：TP311.13

页数：79

在线出版日期：2013-10-08（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于粒度的数据流不确定性信息处理