10.3969/j.issn.1001-2400.2018.04.017
传输触发架构的可编程神经网络处理器设计
卷积神经网络算法存在着算法结构多样和数据交换计算量大的问题.为此,提出了一种基于传输触发体系架构的可编程卷积神经网络处理器.系统采用多通道直接存储器访问通道、多端口存储器和专用池化数据通道组成数据传输网络解决了数据交换问题.实验表明,该系统在实现卷积神经网络的加速计算方面,虽然吞吐速率比并行流水线方案慢11%,但与之相比具备可编程、适应不同神经网络的特性,节省了46.5% 硬件乘法器资源,比其他非流水线实现方案吞吐速率至少快40%.该方案具有系统并行度大、可编程、可在线配置和处理速度较高的特点.
深度学习、卷积神经网络、并行处理、现场可编程门阵列
45
TP332(计算技术、计算机技术)
2018-08-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
92-98