Mali T604 GPU 的二维浮点矩阵运算并行优化方法
基于以三星的 Exynos5250处理器为核心的 Arndale Board 嵌入式开发平台,对集成于处理器上的 Mali T604嵌入式 GPU 的 GPGPU(General-Purpose computation on GPU)技术进行研究,并对不同运算规模的浮点矩阵乘法进行并行加速优化,提供实际测试结果。Linux 操作系统上的实验结果显示,基于 Mali GPU 的并行浮点矩阵乘法方案相对原始串行算法而言,效率显著提高,并且运算规模的增大可以显著提高并行性。
ARM Cortex A1 5、Mali GPU、GPGPU 技术、Arndale Board 开发平台、OpenCL、Exynos5250
TP311(计算技术、计算机技术)
2015-05-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
43-46