学位专题

<

基于深度学习的发票识别研究

刘奕杰
西安石油大学
引用
在现代信息社会,由于国民经济的健康发展与科学技术的提高,人们的经济活动也变得更加频繁,发票成为了记录经济活动的重要载体。然而,在传统的发票录入流程中,大多数录入工作都需要人工完成,这种录入方式效率低下且浪费人力资源。随着光学字符识别(Optical Character Recognition,OCR)技术与深度学习技术的兴起,给人们自动化的信息提取提供了极大的便利,因此,利用深度学习技术来解决发票的快速识别具有重要的现实意义。  本文基于深度学习技术对发票识别算法开展研究工作,以最常见的发票为例,根据发票图片的内容特点,将发票识别任务分为两个主要步骤:文本区域检测和文字识别,并通过两个基于深度学习的算法模型实现发票的快速识别,本文主要工作如下:  (1)发票文本区域检测部分,选用PseNet网络模型作为基本框架进行发票文本区域检测。在原有的网络结构中加入了可以扩大感受野的形变卷积,提高了模型的特征提取能力;结合工作实际,根据发票文本的实际场景进行分析,引入了dice coefficient loss损失函数,有效避免了检测结果偏向非文本区域;收集发票图片并制作发票数据集作为模型训练数据,进一步提高了发票文本区域的检测精度,发票文本区域检测准确率提升了4.3%,实验结果表明了本文方法的可有效性。  (2)发票文字识别部分,选用CRNN模型开展文字的识别研究,针对文字识别的数据集庞大、场景广泛以及文字识别模型训练困难等问题,制作了部分发票字符数据集;在模型训练环节利用了基于共享参数的迁移学习方法对CRNN模型进行二次训练,文字识别的准确率由90.4%提升到了94.8%,并减少了训练时间和物理设备的消耗。  最后,本文基于深度学习技术,将发票文本区域检测与文字识别算法结合起来进行发票识别实验,实现了一种端到端的发票识别的方法,获得了良好的识别效果,实验结果表明了方法的可行性。

发票识别;文本区域检测;文字识别;深度学习

西安石油大学

硕士

控制工程

穆向阳;李菁

2022

中文

TP391.41

2023-05-23(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅