基于深度学习的藏文古籍文献文本检测研究

王梦锦

西藏大学

下载全文

在线阅读

引用

摘要：

深度学习的高速发展，引起了众多研究学者的关注，而文字作为人类相互交流获取信息最直接表达方式，在我们日常生活中缺一不可。由于藏族区域信息科技发展比较缓慢，藏文的检测与识别的相关研究较少，藏文整体结构复杂，与中英文差异较大，所以不能完全使用中英文检测与识别的成熟技术，需要根据藏文自身的特点，改进中英文检测识别技术，设计出更适合藏文的检测与识别系统。　　本文重点对基于深度学习的藏文古籍文献文本进行检测，灵活运用了神经网络，实现了藏文古籍文献文本行的定位。使用自然场景下的文本检测算法在于藏文古籍文献有着类似于自然场景下的文本特点，外界干扰物多，背景复杂。本文主要使用了两种不同的模型对藏文古籍进行检测，具体的工作如下：　　(1)本文对藏文古籍数据集进行了分析，并使用GAN数据扩充增加了数据集的数量，建立了一个藏文古籍文献数据集，总共包含了3396张图片，对图片进行标注分析，用于藏文古籍文献文本检测算法的训练。　　(2)本文采用基于CTPN模型的藏文古籍文献文本检测方法，CTPN是一个基于CNN与RNN相结合的检测算法，利用VGG16对图像进行特征提取，双向LSTM对字符序列的特征进行学习，最后用NMS来对预测出的文本框进行细化，用文本线构造法将预测文本框合并成一个整的文本框。实验表明，CTPN模型下的藏文古籍文献文本检测取得了不错的性能，算法的精确率为0.89。　　(3)本文采用EAST模型对藏文古籍文献进行文本检测。EAST是基于FCN与NMS相结合的检测算法，用FCN直接产生文本框预测，再使用LNMS来删除多余的文本框，删除了不必要的中间步骤，进行端到端的训练和优化，但在藏文古籍上的文本检测的精确率不高，需要进一步的研究。

关键词：藏文古籍文献;深度学习;文本检测

授予单位：西藏大学

授予学位：硕士

学科专业：计算机系统结构

导师姓名：拥措

学位年度：2020

语种：中文

分类号：H214;TP391.1;TP18

在线出版日期：2021-02-04（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于深度学习的藏文古籍文献文本检测研究