图像中字符定位方法的研究

张绪进

西安理工大学

下载全文

在线阅读

引用

摘要：

随着多媒体技术的发展，数字图像(视频)在各个领域的应用越来越广泛，能够从图像(视频)中检索到所需的信息成为人们迫切的要求。在图像(视频)中，字符信息在一定程度上反映了本幅图像(视频)的部分内容，因此自动定位图像中的字符区域，并抽取这些文字信息，是其关键步骤。文献中提出图像中字符边缘体现出的纹理具有方向性，即水平、垂直、斜向走向。首先提取字符的横向、竖向纹理的方向信息，然后根据各自的阈值把候选字符区标识出来，用形态滤波的方法消除噪声，最后用斜向纹理的平均斜向能量判断是否是字符区。文献中将此模型用在以DCT为编码基础压缩数据上，效果较好。本文将其算法中的能量定义利用块间的信息重新定义，并且采用自适应动态阈值对原算法进行改进。对比实验结果表明，改进的方法对图像字符定位比原方法准确率更高，漏检情况有一定程度的降低，取得了较好的效果。同时本文将此模型推广到小波分析中来定位字符。

关键词：数字图像;视频图像;字符区域;字符定位;小波分析;信息处理

授予单位：西安理工大学

授予学位：硕士

学科专业：信号与信息处理

导师姓名：张二虎

学位年度：2004

语种：中文

分类号：TN911.73;TN941.1

页数：59

在线出版日期：2006-12-08（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

图像中字符定位方法的研究