10.3969/j.issn.1000-386x.2016.09.066
使用 GPU 加速计算矩阵的 Cholesky 分解
针对大型实对称正定矩阵的 Cholesky 分解问题,给出其在图形处理器(GPU)上的具体实现。详细分析了 Volkov 计算Cholesky 分解的混合并行算法,并在此基础上依据自身计算机的 CPU 以及 GPU 的计算性能,给出一种更为合理的三阶段混合调度方案,进一步减少 CPU 的空闲时间以及避免 GPU 空闲情况的出现。数值实验表明,当矩阵阶数超过7000时,新的混合调度算法相比标准的 MKL 算法获得了超过5倍的加速比,同时对比原 Volkov 混合算法获得了显著的性能提升。
图形处理器、乔里斯基分解、加速比、混合算法
33
TP361(计算技术、计算机技术)
湖北省自然科学基金重点项目ZRZ2014000286。
2016-10-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
284-287,305