FPGA实现的卷积神经网络硬件加速器数据传输引擎
本文基于FPGA实现了一种数据传输引擎,解决了传统直接存储器存取(DMA)带宽利用率低、无法支持三维数据的读写等问题.本文将片内缓存的功能设计在DMA,降低了数据传输引擎的设计难度.本文在Xilinx Zynq XC7045上实现了该数据传输引擎,在200 MHz的时钟频率下最高能达到4 Gbps的带宽和100%的带宽利用率.
卷积神经网络、加速器、数据传输引擎、DMA、XC7045
21
TP331.2(计算技术、计算机技术)
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
55-58