同构和数据挖掘若干理论问题研究及相关应用

班桂宁

广东工业大学

下载全文

在线阅读

引用

摘要：

流域水污染的综合治理是关系到国计民生的大问题，是国家可持续发展必不可少的环节。我的导师张新政教授在这方面很早就做了大量工作，建立了一系列具有深远意义的结果，解决了一系列实际问题。本文是基于导师主持的国家自然科学基金资助项目《流域水污染时滞大系统的建模与控制》（03.1-05.1）的理论需要，研究同构问题和数据挖掘知识发现。值得注意的是，我们在研究如何获取数据挖掘知识发现的工具-转移时应用了有限群理论的深刻的结果。本文研究的主要内容为：有限群同构问题，基于粗糙集理论的知识聚类和约简新方法。数据挖掘知识发现新工具新方法，本研究获得的理论成果的应用，主要是关于经济和流域水污染总量的建模与控制的应用。本文主要工作、成果及核心部分归纳如下。（1）第一章概述有限p-群的自同构群理论、粗糙集理论和数据挖掘知识发现的基本概念、基本结论和研究现状，阐述同构、粗糙集和数据挖掘知识发现理论和应用研究对解决实际问题的作用和意义，给出本文的组织结构和研究内容。（2）为了更加深刻地了解图形的对称性和系统整体布局的协调性，本文研究了有限p-群的自同构群，解决了著名群论专家Rodney.James1980年遗留下来的问题：计算p6阶群的自同构群的阶，相应结果在信号的发送接收纠错、地理信息系统、全球定位系统和计算机图形学等有应用前景。（3）为了定性研究水污染系统的建模与控制，尤其是基于数据的建模与控制，本文研究了粗糙集理论，提出了知识聚类和约简新概念，给出了新方法，力求用最少的性质（关系）刻画复杂的系统。我们不但推广了Pawlak关于知识聚类与约简的主要结果，而且在更大的系统（空间）里，统一了Pawlak的知识聚类约简和我们的知识聚类约简，并给出了相应结果的算法（尤其是数值算法）和实现途径。我们知道，多一种属性就是多一个模型，如果我们能够约去一个属性，就可能使我们以前不能解决的问题获得解决，问题的难度也随之变低，棘手的问题也可能成为得心应手，这一点，在第五章研究所得理论成果的应用时，就用在讨论模型的最佳叠加上，它是我们解决该问题的关键。（4）为了定量研究水污染系统的建模与控制，尤其是基于监测数据的水污染总量建模与控制，本文从推广最小二乘逼近有关结果着手，去掉阻碍实际应用的线性无关的限制，把权变成了便于实际应用的权，通过新工具转移，把Newton前后插值（Newton后插可以用于预测决策），Chebyshev多项式，Fourier变换（算法上用快速Fourier变换才能实现）和广义Fourier级数应用于数据挖掘知识发现，主要足针对海量数据的挖掘。我们引入的转移方法，使Chebyshev逼近和Fourier变换在数据挖掘知识发现中得到了完美的统一和广泛的应用。最令人感兴趣的转移是小导数转移，我们发现，小导数转移可以减少知识在转移过程中的损失，也就是说，转移类似于电子学中的导体（理论上，零导数脉冲转移相当于超导）。（5）理论结果的实际应用。借助于机理分析方法，我们先把所得的结果应用于经济方面，主要是探讨经济活动中经常遇到的几个实际问题，然后提出污染总量控制最佳公式，它可以用来研究流域（尤其是源头）水污染系统的建模与控制，为水污染总量控制（特别是非点源）政策的制定和实施提供科学依据。事实上，本文得出的最佳公式是两个数据挖掘模型的最佳线性组合（叠加），一般地，我们可以考虑若干个数据挖掘模型的最佳线性组合，遗憾的是，它的计算难得惊人。研究模型的叠加，用数量较少的模型叠加出纷繁错综的现实世界中各种各样模型是我们研究建模问题的一个重要手段之一。（6）本文的总结、存在问题、遗留问题和今后的研究工作。本文最后一章总结了本文的主要成果，特别是创新成果，然后指出本文存在的问题和遗留的问题，给出解决这些问题的研究方法和技术路线，在此基础上，构思今后的研究工作、研究方向和主攻关键。

关键词：有限群;数据挖掘;知识发现;粗糙集;总量控制;流域水污染;污染治理;自同构群

授予单位：广东工业大学

授予学位：博士

学科专业：控制理论与控制工程

导师姓名：张新政

学位年度：2009

语种：中文

分类号：TP311.131;X522

页数：217

在线出版日期：2009-12-11（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

同构和数据挖掘若干理论问题研究及相关应用