DOI：10.19665/j.issn1001-2400.2021.06.011

面向超级计算机系统的大规模图遍历优化

引用

摘要：

现实中的数据问题通常被抽象为图.在大数据时代,图数据趋于复杂,这是因为数据量大幅提升,所需要的计算规模迅速增长.大规模的图数据问题对超算平台的存储运算能力具有广泛需求,并对此提出了更高的要求.为了高效地处理大规模图数据,发挥天河超级计算机实验平台的图处理能力,基于现实世界中图结构的小世界性和无尺度性特征,面向评测超级计算机图处理能力的重要基准Graph500,提出一种主要应用于大规模图的图遍历优化方法.这一方法结合了天河平台的体系结构特征,在图结构上应用了顶点排序和优先缓存策略,即将图中顶点按度数从高到低排序,令程序在图遍历阶段优先访问高度数邻居顶点,并将部分关键高度数顶点缓存至天河系统核组内的高速缓存中,以此来减少Graph500基准程序中的无效访存,降低进程间的通信开销,提高访存带宽利用率,从而有效地提升Graph500基准测试程序在天河平台上的性能.面向天河超级计算机系统实验平台提出的应用顶点排序与优先缓存优化方法的VS-Graph500程序,其加速的效果显著,可扩展性好.当图测试规模为237时,全系统稳定测试性能为2 547.13 GTEPS,超过2020年11月Graph500国际排名榜上第7名的数据.

关键词：Graph500基准、图结构、顶点排序、优先缓存、超级计算机系统

所属期刊栏目：48

分类号：TP391(计算技术、计算机技术)

资助基金：国家重点研究发展计划项目;国家自然科学基金;国家数值风洞项目;国家数值风洞项目;国家数值风洞项目;PDL基金;PDL基金;湖南省自然科学基金

在线出版日期：2022-04-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：84-95

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

面向超级计算机系统的大规模图遍历优化