学位专题

<
DOI:10.7666/d.w025256

图像中字符定位方法的研究

张绪进
西安理工大学
引用
随着多媒体技术的发展,数字图像(视频)在各个领域的应用越来越广泛,能够从图像(视频)中检索到所需的信息成为人们迫切的要求。在图像(视频)中,字符信息在一定程度上反映了本幅图像(视频)的部分内容,因此自动定位图像中的字符区域,并抽取这些文字信息,是其关键步骤。文献中提出图像中字符边缘体现出的纹理具有方向性,即水平、垂直、斜向走向。首先提取字符的横向、竖向纹理的方向信息,然后根据各自的阈值把候选字符区标识出来,用形态滤波的方法消除噪声,最后用斜向纹理的平均斜向能量判断是否是字符区。文献中将此模型用在以DCT为编码基础压缩数据上,效果较好。本文将其算法中的能量定义利用块间的信息重新定义,并且采用自适应动态阈值对原算法进行改进。对比实验结果表明,改进的方法对图像字符定位比原方法准确率更高,漏检情况有一定程度的降低,取得了较好的效果。同时本文将此模型推广到小波分析中来定位字符。

数字图像;视频图像;字符区域;字符定位;小波分析;信息处理

西安理工大学

硕士

信号与信息处理

张二虎

2004

中文

TN911.73;TN941.1

59

2006-12-08(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅