10.15918/j.tbit1001-0645.2019.03.008
一种新的场景文本识别模型
提出了基于残差网络和注意力机制的LRAM(LSTM with ResNet and attention model)模型,在模型中引入残差模块(ResNet),加快了网络的收敛速度,降低了网络训练难度;引入注意力机制(AM),实现了不同序列对当前文本识别的权重分配,提高文本识别的准确率.通过在Synth90K,Street View Text和ICDAR等数据集测试结果,与已存在的模型相比,LRAM性能超过现存其他网络模型.
序列文本识别、长短记忆网络、残差网络、注意力模型
39
TP18(自动化基础理论)
国家自然科学基金资助项目61370195,U1536121
2019-05-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
269-275