10.3969/j.issn.1000-386X.2011.11.058
面向国产CPU SW-1600的向量重组
由于向量化重组指令比较复杂并且不同指令有不同的延迟,从而难以寻找一种统一高效的向量重组算法.对国产CPUSW-1600提供的移位和插入提取指令进行了分析,提出单独依靠移位或插入提取指令实现向量重组的最优算法,并综合这两类指令实现向量重组的高效算法.最后通过实验证明该算法可以较好地对程序进行向量化,对整型数据的加速比达到7.31,对复杂的双精度浮点型程序的加速比也达到1.83.
SIMD(Single Instruction Multiple Data)、SW-1600、向量重组、SLP
28
TP311(计算技术、计算机技术)
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
230-233,275