学位专题

<
DOI:10.7666/d.y933751

基于虚拟仪器的字符图像识别系统研究

程浩
河北农业大学
引用
随着信息时代的到来和计算机应用的普及,世界各国对信息产业的发展都给予了极大的重视和关注。但在信息技术高速发展的同时,一个难题也摆在我们的面前,那就是计算机数据处理和网络传输的高速度与数据输入的低速度之间的矛盾。如何将记录在纸上的大量的文字图像信息快速可靠的输入计算机,转变为便于计算机识别和处理的字符信息,在一定程度上成为影响社会信息化进程的重要因素。人们接受信息最频繁的是视觉通道。在日常学习和生活中,所处理的信息有75﹪-85﹪是视觉信息,其中文字信息愈来愈占重要地位。要实现对这些文字信息处理过程的机械化、自动化,其先决条件就是利用计算机对文字信息进行识别。 本课题研究了字符图像的计算机识别问题。字符根据书写方式的不同,分为印刷体字符和手写体字符。系统针对每种字符各自的特点,通过对字符的预处理,提取字符本身特征,然后运用特定的识别算法,实现了字符图像的自动识别。整个系统包括图像采集、预处理、特征提取与字符识别四个部分。 图像采集硬件包括主频为2.8GHZ、内存为512MB的联想启天M6200计算机,NI公司的PCI-1411图像采集卡和自制的图像采集箱。采集箱中采用黑色背景设计,内装有PanasonicWV-CP240/G彩色摄像机作为系统的输入传感器,40W环形灯作为照明设备,保证了图像采集的质量。 将采集到的图像经灰度转换和二值化处理、噪声去除、图像增强、特征定位、边缘提取、字符分割等预处理过程,形成了特征突出、便于后续处理和识别的单个字符图像。在特征定位过程中,设计了根据检测被测票面两相邻直角边位置的方法来建立相对坐标系,在此坐标系中确定字符位置的特征定位算法。 根据印刷体和手写体字符识别的需要,系统采取了不同的特征提取策略。对于印刷体字符,在对字符进行了归一化和细化处理后,采用网格特征和交叉点特征相结合的方法作为其字符特征,建立字符标准信息库。而对于手写体字符,设计了基于边界特征和孔洞、笔画特征相结合的特征提取算法,完成了字符特征的提取。 印刷体字符采用模板匹配算法实现了字符的识别,利用待识别字符与字符标准特征库相比较,把待识别字符识别为与其特征向量的欧氏距离最小的特征向量所代表的标准字符。而对于手写体字符,系统采用BP神经网络来实现字符的识别。 系统软件由NI公司的虚拟仪器软件Labview及图像处理工具包IMAQVision开发,实现了图像的采集、预处理、特征提取和字符识别等功能。该软件操作简单,界面友好,可靠性高。经实验表明,印刷体字符的识别准确率为95.5﹪,手写体字符的识别准确率为90.3﹪。

虚拟仪器;字符识别;字符图像;模板匹配;BP神经网络;图像处理;计算机识别

河北农业大学

硕士

农业机械化工程

钱东平

2006

中文

TP391.4

54

2007-05-23(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅