学位专题

目录>
<

基于进化计算的网络社团挖掘研究

陈正鹏
西南大学
引用
现实世界中的很多复杂系统,都可以抽象成图的形式,而复杂网络是研究各类系统普适性特征的有效工具。随着网络科学的发展,社团结构被证实为复杂网络的普遍性质。社团挖掘旨在识别网络中特定的社团结构,不仅对分析复杂网络拓扑结构、揭示复杂网络中的规律和预测复杂网络演化具有重要意义,而且有着广泛的应用前景,如社交网络上的信息传播分析,蛋白质功能预测,推荐系统优化等等。  但是随着时代的发展,传统社团挖掘算法面临新的考验:1)网络数据规模增加,如何提高静态网络社团挖掘算法的效率是亟需解决的问题;2)网络呈现动态性,如何高效准确地捕捉网络的社团演化过程是亟待解决的问题;3)网络呈现层次性,如何挖掘出复合社团结构从而深层次地了解系统的全貌是目前的研究热点。  针对现有的社团挖掘算法面临的静态社团识别效率低、动态社团结构不稳定,复合社团划分不合理的不足,本文围绕进化算法求解网络社团挖掘问题,将社团挖掘转化成优化问题,结合生物仿生模型和多目标优化理论,以“如何提高静态网络社团挖掘算法的效率”、“如何识别高质量且稳定的动态网络社团结构”和“如何识别具有较高全局特征的多层网络复合社团结构”为主线。针对静态网络社团挖掘,提出了一种基于多头绒泡菌仿生模型的离散粒子群优化算法。针对动态网络社团挖掘,提出了一种基于分解的多目标离散粒子群优化算法。针对多层网络社团挖掘,探究了现阶段多目标进化算法在多层网络上的研究现状和应用前景。本文的主要研究贡献可以概括为以下三个方面:  (1)针对静态网络社团挖掘问题,采用离散粒子群优化算法求解该问题。设计基于数字串的编码方式利于解码,方便计算适应度值。通过结合网络拓扑邻居的信息和基于贪心的模块度增量策略,修改传统粒子群算法的速度和位置更新公式。并介绍一种多头绒泡菌网络模型(PNM,Physarum network model),可以在一定程度上识别网络社团间和社团内的边。之后,将PNM模型对社团边属性的识别作为先验知识,对粒子群算法的种群初始化进行指导,提出了一种基于多头绒泡菌仿生模型的离散粒子群优化算法。最后,在计算机生成的基准网络和现实世界的网络数据集上进行对比实验,从准确度、鲁棒性和收敛速度方面证明算法的有效性。  (2)针对动态网络社团挖掘问题,根据演化聚类框架思想, 同时考虑网络社团的结构质量和稳定程度。为了自动确定演化框架中的权重系数和网络的社团数目,同时降低多目标进化算法的计算复杂度,使用基于分解的多目标粒子群优化算法进行问题求解,该算法分别以网络模块化密度和标准化互信息作为优化目标,采用切比雪夫(Tchebycheff)聚合的方式评价个体的适应度值。基于单目标粒子群优化算法,重新设计算法的初始化过程和最优个体状态更新规则,并设计帕累托(Pareto)最优解选取策略,从Pareto最优前端上选取模块化密度最大的解作为当前时刻的社团划分,同时当作下个时刻网络社团挖掘的参照。最后,通过对4类基准网络和7个真实网络数据集上的实验证明了算法的有效性,并对动态社团结构的演变进行了可视化。  (3)由于多层网络社团挖掘研究刚刚起步,缺少清晰、统一的定义,本文仅探讨现阶段多层网络社团挖掘的相关理论基础和研究成果,介绍了两种不同类型的多层网络:复合型多层网络和相互依赖型多层网络。针对复合型多层网络的社团挖掘问题进行了形式化定义,汇总现阶段多层网络社团挖掘研究成果,特别是基于多目标进化计算的多层网络社团挖掘算法,为基于进化计算的多层网络社团挖掘研究奠定理论基础。  综上,本文在复杂网络理论基础上,结合进化计算和多目标优化理论进行静态和动态网络社团挖掘,并探讨了多目标进化算法在多层网络社团挖掘中的有效性和应用前景。同时,通过大量实验证明了基于进化计算框架的社团挖掘算法的有效性。

复杂网络;社团挖掘;动态网络;多层网络;进化计算;多目标优化理论

西南大学

硕士

计算机系统结构

高超

2019

中文

TP393.09;TP301.6

2019-12-10(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅