5.1.2 系统处理流程图及主要工作图5.1系统处理流程图在整个

简介: 5.1.2 系统处理流程图及主要工作图5.1系统处理流程图在整个课题中,主要完成以下工作:1) 通过画图软件获得训练和测试样本(也可以直接选择经过数码相机怕照

经过识别研究的长期发展,数字识别的理论和算法得到了进一步的完善,但如何将其有效地应用到实际生活中仍然是一个严峻的问题。

在国内外手写体数字识别的研究中,近几十年来,研究人员提出了许多识别方法其中识别方法有两种:结构特征法和统计特征法。

经过各国研究人员几十年来对数字识别的研究,国内外在手写体数字识别方面取得了一些成果,而真正的无限制手写体数字识别的研究还需要进一步完善。

本文首先介绍了OCR和手写体数字识别,包括OCR和手写数字识别的历史和现状;本文对预处理灰度化、二值化、去噪、归一化、细化等技术,进行了详细分析,本文对几种阈值分割进行了比较,分析了各自的优缺点,在不同的环境情况下选择不同的预处理技术,在神经网络分类识别器实现原理,并给出本文采用的学习算法和训练算法,最后介绍了本文实现的系统的开发和运行环境,以及系统的处理过程图、系统界面,给出实验结果分析,该系统能够有效的识别出图片上的手写数字。

通过实验测试,本文设计的系统取得了较好的识别效果并具有良好的抗噪能力,但是还需要从预处理和特征选择方面做更深入研究,有待进一步提高系统的识别率并且为了获得更好的识别效率,从特征向量入手,应想办法提取更精确的特征向量,比如投影特征、环凸凹特征等。

【关键词】手写体数字 预处理 bp神经网络 特征提取AbstractArtificial intelligence has become a hot topic at the moment. More and more researchers are engaged in research into artificial intelligence. In everyday life, figures can be seen everywhere. An important direction of character recognition is number recognition. Using the recognition principle as a reference, when the computer can automatically complete the digital recognition as human eyes, it will reduce the pressure for manual recognition of digital information, and the active use will greatly improve people's work efficiency. After the long-term development of recognition research, the theory and algorithm of digital recognition he been further improved, but how it can be effectively appl in real life is still a serious problem. In research on handwritten numerical recognition at home and abroad,Handwritten number recognition methods can be divided into two categories: methods based on structural characteristics and methods based on statistical characteristics. and genuine unrestricted handwritten cipher recognition needs to be further improved.First, this document ioduces OCR and handwritten number recognition, including the history and current situation of OCR and handwritten number recognition; It examines the preprocessing technology in handwritten number recognition. In this paper, pre-processing technologies such as grazing, binarization, denoisation, normalization and dilution are analyzed in and examines the self-value extraction process by interface of the system are presented. The test results are evaluated. The system can effectively detect the handwritten digits of the image and has a practical value. Through the experimental test, the but it still needs to carry out in-depth research on aspects of pretreatment and function selection. It should further improve the recognition process of the system. To achieve better detection efficiency, starting from the function vector, we should find ways to extract more accurate function vectors such as projection functions, ring convex functions and so on.【关键词】MATLAB; Handwritten numeral recognition pre-treatment bp network feature extraction.目 录1 绪论 21.1 字符识别概述 21.2 数字识别研究的目的及意义 21.3 手写数字识别的典型应用 31.4 国内外研究现状 41.5 手写体数字识别系统概述 51.6 本文内容安排 62 手写体数字识别中预处理技术 72.1 图像灰度化 72.2 图像二值化 82.3 图像反色 92.4 图像去噪声 102.5 数字分割 112.5 数字归一化 112.5 数字细化 133 手写体数字识别中特征值提取技术 163.1 特征提取概述 3.2 手写体字符特征提取方法概述 3.3 手写体数字识别中的结构特征提取 193.4 手写体数字识别中的统计特征提取 4 人工神经网络分类器 4.1 人工神经网络概述 4.2 BP神经网络概述 4.3 本文的神经网络结构设计 5 系统实现与结果分析 5.1 系统实现 5.1.1 系统实现环境 5.1.2 系统处理流程图及主要工作 5.1.3 系统界面 5.2 结果分析 266 结束语 参考文献 致谢 29附录..............................................................301 绪论 1.1 字符识别概述OCR是一种光学检测字符识别技术,是通过扫描仪把印刷体或手写体文稿扫描成图像,然后识别成相应的计算机可直接处理的字符。

字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)另一类是数据信息,主要是数字符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行等等,处理这类信息的核心技术是手写数字识别。

在OCR扫描领域中,最为困难的就是脱机手写字符的识别。

相关人员多年研究,在手写数字识别这个方向上,已经入手下手把它向各种实际运用中,为手写数据的高速输出供给了一种重要办法。

因此,世界各国对信息产业的发展都给予了极大的关注和重视。

目前人类的许多信息是记录在纸上的文字图像,将这些信息输入计算机是非常繁琐而低效率的工作,这在一定的程度上减缓了社会信息化的进程。

因而,作为信息化基础的数据输入成了计算机应用中的瓶颈问题。

人们接受信息最频繁的是视觉通道.在日常学习和生活中,所处理的信息有75%—85%是视觉信息,其中文字信息愈来愈占重要地位.比如对各种期刊文献的阅读、查找、翻译:对各种统计报表的汇总、计算、分析;对各种函件票证的分拣、传送、验核等。

要实现这些文本信息处理的机械化和自动化,前提是利用计算机对这些文本信息进行识别一旦研究成功并投入使用,将产生巨大的社会效益和经济效益。

(一)手写数字识别在大规模数据统计中的应用在大规模的数据统计(如:行业年鉴、人口普查等)中,需要输入大量的数据,近年来在这类工作中采用OCR技术已成为一种趋势。

因为在这种应用中,数据的录入是集中组织的,所以往往可以通过专门设计表格和对书写施加限制以便于机器的自动识别。

可以看出,这是一类相对容易的应用,对识别核心算法的要求比较低,是目前国内很多单位应用开发的热点。

(二)应用领域在我国随着经济的快速发展,每天等待处理的表格数据等越来越多。

如果能统一处理,可提高效率但是实用难度大,原因有:1、识别精度低;2、处理的表格通常不止一种,识别效率差;3、由于处理贯穿于整个日常工作之中,书写应尽量按一般习惯(如:不对书写者的写法做限定,书写时允许写连续的字串,而不是在固定的方格内书写),这样对识别及预处理的核心算法要求也提高了。

1.4 国内外研究现状通过几十年来各国研究学者得对数字识别的研究,国内外在手写识别上也取得了一定的成就。

在我国邮电部第三研究所,以信函分拣为目的,识别书写在信封上的邮政编码。

其它用传统方法进行识别研究的有中国科学院自动化研究所,该所对手写体数字识别的研究历史几乎有20年了,在他们新近的报告中,利用以有限状态自动机为主的识别途径识别1100个手写体数字,识别率达95.2%,拒识4%,误识0.2%,基于上海交通大学压缩字符结构特征的手写体数字识别算法选取12600个样本组成训练集,6000个样本组成测试集。

清华大学使用支持向量机识别金融中的手写数字,并测试了20000个样本,识别率约为92%。

然而以上提到的系统,要么对书写的正规程度有要求,或者对书写位置有要求,或者对所用笔、纸有要求,例如对税务报表的识别就要求用规定的字型书写数字,并且对书写的位置有要求,而真正的无限制手写体数字的识别的研究还有待进一步提高。

图1.2 图像预处理流程图神经网络数字识别的具体流程如图1.3 所示。

图1.3 神经网络数字识别流程图1) 图像预处理阶段在获取原始数字图像过程中,由于光照、背景纹理、镜头分辨率、拍摄角度等原因,难免会造成图像失真并带有噪声。

由于这些噪声的影响,如果对获取得到的数字图像进行直接处理的话通常不能得到满意的结果,在获得原始数字图像数据后,进行图像进行预处理分析。

经过预处理后的图片不仅能够有效滤除噪声,并且可以将不同大小的字符归一化到一个固定的大小,压缩大量的数据。

2) 特征提取阶段由于原始数字图像数据量大,冗馀信息较多,一般不直接识别,而是要提取有效的特征数据,压缩数据,然后进行识别。

也就是说,特征提取是去除对分类无帮助的图像信息,图像信息集中在几个具有代表性的特征上。

3) 数字识别阶段我们将提取到的特征值输入到已经训练好的神经网络中进行分类识别。

同时,本章对几种阈值分割进行了比较,分析了各自的优缺点。

初步介绍本文采用P神经网络,并给出本文采用的学习算法和训练算法。

第五章:介绍了本文实现的系统的开发和运行环境,以及系统的处理过程图,系统界面。

2 手写体数字识别中预处理技术预处理对于一个良好的识别系统不仅是一个必不可少的环节,而且是至关重要的。

如果预处理处理得不够理想,会从很大程度上降低整个系统的识别率。

彩色图像的每个象素的R、G、B值是不相同的,所以显示出红绿蓝等各种颜色。

对读取到的图片进行灰度处理,为下一步二值化做好准备工作。

图像灰度化有各种不同的算法,比较直接的一种就是给象素的rgb 值各自一个加权系数,然后求和。

图像的二值化就是把图像中的象素根据一定的标准分化成两种颜色,一方面类似于字符,指纹,图纸等的图像本身就是二进制的。

另一方面,在某些情况下即使图像本身是有灰度的,也将其转换成二值图像再处理。

图像的二值化有几种类型,其中主要的有基于基于灰度分布的二值化处理通常是通过设置阈值,可以按照下列处理图像二值化阈值:假设一幅原始图像像素值p(i,j)的取值范围为[0,m],那么设有其阈值为T=t,0

对于字符识别来说,只需要保留文字特征的二值信息即可。

目前,众多学者对此已经进行了比较详细的研究,并提出了许多阈值选取的算法,分别是整体阈值法、局部阈值和动态阈值方法。

对于书写质量差、干扰严重的字符,整体阈值法的二值化效果不理想,局部阈值法效果最佳。

3) 动态阈值法当阈值选择不仅取决于该象素阈值及其周围各象素的灰度值,而且还和象素坐标位置相关时,称之为动态阈值法。

对文字图像而言,由于笔画和背景的区分比较明显,并且动态阈值法的实现较为复杂、计算时间相对长,因此在文字识别中很少采用。

对于以上三种二进制化算法,动态阈值方法的实现比较复杂,需要时间较长,很难满足文字识别中的实时性要求,因此该算法在字符识别系统中很少被采用。

鉴于在实际中,考虑到所要进行处理的图像大多是从印刷出版物上扫描得来的底色大多为白色所以我们将这个阈值固定为230。

图2.3二值化效果图2.3 图像反色图像的反色工作只是为了后期处理识别图像方便,并不是必须的过程。

如果输入不良伴有较大的噪声,滤波去噪后不能达到理想效果,将必然的严重影响处理的全过程以至最后的识别结果。

但是那样的算法不适合用在处理字符这样目标狭长的图像中,因为在滤波的过程中很有可能会去掉字符本身的象素,本次是去除杂点来去噪声处理的:1)扫描整个图像的每个象素并取得此象素9领域的象素值(如图2.5)。

2)分别计算0和1的总数S0,S1。

图2.5 领域示意图经过上述算法去离散噪声后,很好的排除了离散噪声点的干扰。

在识别时,只能根据每个字符的特征进行判断,因此有必要进行字符分割,这一步是独立分割图像中的字符。

具体的算法如下:第一步,先自下向上对图像进行逐行扫描直至遇到第一个白色的象素点。

当遇到第一个白色像素时,将其作为字符分割的初始位置,然后继续扫描。

按照上述方法,继续扫描到图像的最右端,以获得每个字符相对准确的宽度范围。

第三步,在每个字符的已知宽度范围内,具有更精确的度数,按照第一步的方法,执行自上而下和自下而上的逐行扫描,以获得每个字符的确切高度范围。

图2.7数字分割效果图2.5 数字归一化对于字符识别来说,归一化是一个很重要的预处理因素。

对于大小不一的字符图像,处理起来很不方便,因此在通常情况下,归一化处理一般的是将单字符图像进行归一化到固定的大小的数字图像,例如本文采用的归一化后的数字图像大小为16×16。

位置和大小的归一化主要在这里进行,笔画的归一化可以看作是数字的细化。

(1)位置归一化为了消除数字点阵位置上的偏差,需要把整个数字点阵图形移动到规定的位置上,这个过程称作位置归一化。

基于质心的位置归一化方法首先计算数字的质心,然后将质心移动到指定位置。

(2)大小归一化对不同的数字做变换,使之成为尺寸大小的数字,这个过程被称做大小归一化。

因为扫描进来的图像中字符大小存在较大的差异,而相对来说,统一尺寸的字符识别的标准性更强,准确率自然也更高,标准化图像就是要把原来各不相同的字符统一到同一尺寸,在系统实现中是统一到同一高度,然后根据高度来调整字符的宽度。

本文主要的大小图像归一化、字符图像分为标准范围内,便于处理与识别。

再得到宽度高度之后,把新图像里面的点按照插值的方法映射到原图像中。

比例缩放原图像找不到相应的像素点,这必须进行插值。

插值处理有两种常用的方法,一种是最接近的插值方法,即直接赋值为和它最相近的像素值,这种方法计算简单,但有时会出现马赛克现象。

另一种是通过一些插值算法来计算相应的像素值,常采用线性插值法,原理是,在计算分数像素地址,比周围的四个像素的距离,该算法处理效果要好些,但是运算量比较大。

在本次设计中,主要是对数字图像进行压缩,直接采用了最邻近插值法,处理后的效果比较好。

图2.8 归一化算法流程图图2.9 归一化效果图2.5 数字细化字符优化是一种通过某些处理算法保留字符的重要像素、删除无关紧要的点并获取字符笔触骨架的技术。

对字符识别而言,字符图像上的各个像素点对识别率的贡献并不一样,精细化处理可以大大消除字符图像中的冗余点,使计算机在分析处理、识别时不受笔划粗细的影响,快速的接触到本质内容,减少运算量,从而缩短识别的时间,最终影响到整个字符识别系统的识别率,因而字符细化已成为字符识别系统中极为重要的环节之一。

在图像分析中,形状信息是十分重要的。

为了描述形状信息和提取特征,这些细线处于图形的中轴附近,而且从视觉上来说仍然保持原来的形状。

经过细化的文字图像既保留了原文字绝大部分特征,又利于特征提取,而且图像字符点阵比原图像的要少,降低了处理工作量。

但是由于细化骨架有可能会造成新的畸变,增加对识别的干扰和困难,所以文字细化的基本要求如下:1) 要保持原有笔划的连续性,不能由于细化造成笔划断开。

4) 要保持原有的拓扑、几何特征,特别是一些明显的拐角不应被平滑掉。

按照上面的要求,一副图像的细化骨架就可以表示原始图像中物体的结构,所以在物体识别和物体定位中,常常使用物体的细化骨架信息。

由于细化骨架具有良好的结构描述特性,细化算法大致分类如下:1) 按细化后图形的连续性分,有四邻域连接算法,八邻域连接算法。

用M×N(一般采用3×3或者5×5)的窗口对某一像素进行检测时,如该点是可删除点,立即删除,则为串行细化处理,它的删除要影响到后续点的检测;如对边缘点全部检测完毕后,再同时更新所有可删除点的值,则为并行细化处理;串行、并行处理混合处理则属于串并行处理。

3) 按细化的运算方式分为两种,即边缘点删除和内点保留。

传统的基于边缘点删除的细化算法,在细化过程中只对边缘点的可删除进行判断并做相应的处理,由于受顺序及所考察领域的影响,容易产生骨架的非对称性;基于内点保留的细化算法,容易使所得的骨架大于一个像素。

本文采用了像素领域分析法的细化算法,在速度和保留结构信息的准确性上较佳。

其算法如下:1) 图像每3 x 3大小的网格,每个网格操作的两倍,其中每个3×3子网格满足如下矩阵形式:2) 在第一次操作时,当且仅当条件G1,G2和G3被全部满足时,则删除中心像素p(即让p = 0)。

条件G2为:,其中,条件G3为:条件G4为 对图像的每个像素执行上述操作被视为完成细化操作,然后重复迭代这个细化运算,直到图像不再变化为止,这时得到的图像中字符笔画均为单像素点,并良好保留了字符的结构信息。

图2.11 细化效果放大图如图所示,数字‘8’经细化后很好的得到了‘8’的骨架。

3 手写体数字识别中特征值提取技术3.1 特征提取概述模式识别使用特征来区分不同的种类,因此,特征提取是模式识别系统的重要组成部分。

特征提取的目标是找到某种变换,将n维或n×n维的模式类别空间转换到维数更小的特征空间,并同时保留识别所需要的大部分信息。

模型特征分类是非常重要的,数字识别的关键是能找到有效的特点,选取的特征是否具有可辨性、可靠性、独立性和特征数量少。

随着特征量的增加,模式识别系统的复杂度将迅速增加。

在一个良好的模式识别系统中,特征提取与选择技术通常介于对象特征数据采集和分类识别两个环节中间,提取和选择的特征的优缺点严重影响着分类器的设计和性能。

在样本数目不是很多的情况下,用很多特征进行分类器设计。

特征提取方法的选择是影响识别率的一个至关重要的因素,必须指出的是,对于不同的识别问题和不同样本数据,使用不同的特征提取方法的适应性差异很大,也就是说,一种特征提取方法对一个问题和数据很奏效对另一个问题或数据可能失效。

一个解决的办法是寻找不同的数据的共同特征,或称不变量。

另一方面,对于有限的训练数据集,如果使用统计分类器,特征集必须保持在一个合理小的数量内。

如果以数字识别来看,在实际过程中,如何选择若干种特征提取的方法取决于识别的用途。

但是对于一个识别系统,为了达到较佳的结果,其它的步骤,如二值化,归一化等也需要优化处理,并且这些处理不是前后互相独立的,特征提取最终判断是在于预处理的结果。

虽然,在一定意义上特征提取和特征选择都是要达到降维的目的,特征提取是通过某种变换的方法组合原始高维特征,获取一组低维的新特征,特征选择就是根据专家的经验和知识或某些评价标准,选择对分类有最佳影响的特征。

当然,也可以在映射之前选择并删除明显没有分类信息的特征。

结构特征和统计特征各有优点:结构特征对细节变化比较敏感,对噪声干扰较大的图像,识别率不高。

统计特征对噪声不敏感,具有较好的稳定性,但对图像细节上的细微差异不敏感,在待识别字符形状较相似时易发生错误。

所以,统计特征和结构特征相互之间具有一定的互补性。

3.2 手写体字符特征提取方法概述进行特征提取,识别算法是根据选取特征的种类来进行选择的。

所选取的特征是否是稳定,是否代表一类字符的特点,是系统识别率的高低关键。

从前一节可以看出,手写字符特征提取的方法可分为结构特征和统计特征两种,下面简要介绍一下这两种特征提取方法的特征和一般方法。

1) 结构特征提取方法采用结构特征提取字符进行结构分析从而达到识别的目的,是一种非常直观的方法,其基本思想是:字符可以逐级分解成部件、笔划乃至笔段,识别时可以自底向上,笔段从像素获得,笔段组合成笔划,笔划构成一个组件,组件构成一个字符,逐级分析字符图像的结构,根据各元素的属性、数量及其互相关系,便可以判定待识字符。

对于不同的手写字符样本,尽管人们的书写风格不同,然而笔划与笔划之间的位置关系,以笔划为基元的字符的整体拓扑结构是不变的。

因此,基于笔画的字符自动识别一直是手写字符识别研究的主要研究方法。

虽然字符的笔划特征受字体、字形大小等影响较小,是识别字符的良好特征,但可惜笔划特征对实际的书写文本来说比较难稳定的提取。

虽然提取笔划或笔段的方法已有多种,但他们都是基于图像处理的方法,截然不同于人根据知识和经验而做出的视觉处理。

单纯基于图像处理方法的笔画分析只能很机械地基于图像,结果提取到的笔段难免与人的判别不完全一致。

因此,寻求稳定可靠的笔段提取方法仍然是当前有待进一步研究的课题。

2) 统计特征提取方法从统计模式识别的角度来看,字符识别应该是模式分类的问题,人对自然物体的识别,是建立在对该物体进行学习、特征分析的基础上的,计算机模式识别的过程与人的识别过程类似。

实际上就是一种通过学习或者其它方法,形成一个记忆知识库,进行模式识别时,清楚地表达从物体图像记忆的知识库,从而得到识别结果。

人在进行物体识别时,是利用大脑中通过学形成的记忆库,对识别出的对象执行黑盒图像,从内存库中查找匹配类别。

此过程实际上就是传统的统计模式识别进行物体识别时所采用的一般方法,具体设计问题的特征提取和分类函数,特征提取是一个困难和关键问题。

然而,对于特征的选择和提取,却没有可遵循的理论来指导,我很难比较对象的特点是大量的,代表哪些特征,哪些特性可能不是重要的或无关紧要的和认可,这需要大量的实验和理论指导。

经过人们在这方面的大量研究工作,提出了一些统计特征提取方法。

可以看出,从手写数字图像中提取特征值,降低维度的信息,提高处理效率同时,系统的识别性能有非常重要的影响。

3.3和3.4节中,我们将详细描述本文所采用的2种特征值(共8+16=24种特征值)的提取方法。

3.3 手写体数字识别中的结构特征提取采用结构特征对字符进行结构分析以达到识别目的是一种非常直观的方法。

与统计方法相比,结构分析不注重特征的绝对位置,只考虑特征的相对关系,因而对书写风格的变化不敏感,其缺点在于特征提取的算法都相对复杂。

穿线法是取得笔划密度的一个通用算法,其基本思想是用一组或几组与水平成0度、30度、45度或者60度等的平行线,贯穿字符,提取字符与平行线的交点信息作为识别的依据。

该算法由于涉及字符拓扑结构方面的信息,因此,它对字符旋转、缩放和变形有很强的耐受性。

文献提出的一种径向贯穿字符的穿线法,该方法以字符重心为坐标原点,从坐标原点分别沿0、45、90、135、180、-135、-90和-45度方向引出八个跨线字符,字符的径向笔划密度由在每个方向上穿过字符的次数组成的向量表示。

但是,当书写风格引起统一字符的之心位置不同时,该方法提取的特征准确性差。

本文采用的是整体贯穿法,该方法就是间隔一定距离从垂直和水平方向上进行整体穿越,由于本文归一化图像的大小为16×16。

因此本文采用方法是间隔4个像素进行从水平和垂直方向进行穿越,从而得到3行、3列上(共6个)的穿越次数统计。

图3.1特征向量的提取 3.4手写体数字识别中的统计特征提取统计特征中最主要的特征为粗网格特征。

粗格网特征是一组专注于整体字符图像的分布特征,具有很强的抑制噪声的能力。

一般来说,虽然手写体数字的书写风格千变万化,但是数字笔划的分布是有一定的规律的。

由于10个字符中风有相对固定的总体布局,从特征选择的质量不同数字的特征向量在特征空间中的分布是比较分散的,即特征空间中不同类的类间距离是比较大的。

如图3.1中1—16这16个特征所示,本文采用的粗网格特征提取的方法是:把数字点阵分成几个局部小区域,并把每个小区域上的点阵密度作为描述特征,即统计每个小区域中图像的像素的个数作为特征数据。

本文对原始图像进行归一化处理后的图像是16×16的点阵,将之划分为大小4×4的小区域,共计16个。

4 人工神经网络分类器4.1 人工神经网络概述人工神经网络,缩写也称为神经网络(NNS)或连接模型,是人脑或自然神经网络的一些基本特征的抽象和模拟。

人工神经网络基于大脑的生理研究结果,其目的是模拟大脑的特定机制和机制来实现特定方面。

并且基于识别系统的基于Von Neumann系统的传统算法,目前在神经网络研究方法中形成多种类型,并且研究工作包括多层网络BP算法,Hopfield网络模型,自适应谐振物理学,自组织特征映射理论。

人工神经网络科学它反映了人脑函数的基本特征,但是从自然神经网络的现实描述中难以更加困难,而是简化的抽象和模拟。

4.2 BP神经网络概述人工神经网络发展中很长一段时间里没有找到隐层的连接权值调整问题的有效算法,直误差反向传播算法(BP算法)被提出后,非线性连续函数的多层前馈神经网络权值调整问题成功解决。

BP神经网络,即误差反向传播算法的学习过程包括两个过程:信息的正向传播和误差的反向传播。

2) 神经网络的层数、以及各层的节点数一般的选择隐含层的层数要从网络精度和训练时间上考虑,对于比较简单的映射关系,在网络精度达到要求的情况下,应该尽量选择较少的隐含层层数,对于较复杂的映射关系,可以通过增加隐含层层数,保证映射关系的正确实现。

对于输入层的节点数,一般与输入的特征向量的个数相同,由于本文提取的字符的特征向量有24个,输入层中的节点数也是24。

对于输出层的节点数,由于数字识别只有10类,2的4次方就可以表示10类,因此本文使用神经网络输出层节点数4。

对于隐含层的节点的个数没有一个理论基于指导,但是根据前人经验,一般参照下列公式进行设计: (式4.1)以上是隐含层中节点数,是输入节点的数量,为输出节点的数量,一般取1~10之间的常数。

因此由式5.1(选择α=9),则可计算得本文采用的隐含层的节点个数为14个。

3) 输出层的值确定在2)中已经指出,本文采用的输出层的节点数为4。

所以,数字0~9的目标向量见表4.1。

表4.1数字0~9的目标向量4) 传递函数确定传递函数影响神经网络的性能,因此各层之间选择一个合适的传递函数也是很重要的。

本文通过对多种传递函数进行测试,最终确定各层的传递函数为:第二层:采用logsin传递函数,即对数S型传递函数。

5) 训练函数和学习函数选择训练函数和学习函数的选择对训练的时间起着至关重要的作用,本文使用的训练函数是traingdx函数,学习函数是learngdm函数。

Emin值小学习效果好,通常所选神经网络的误差范围在0.0001和0.01之间。

此时应该设置一个训练次数的限制NTmin,在达到该训练次数NTmin还没有收敛到Emin时,可以作放弃或停止处理,本文训练BP网络分类器时设定Emin=0.001,最大训练次数为NTmin=5000。

以上为神经网络结构设计过程,图4.2所示的是本文的神经网络对样本数据进行训练的训练曲线。

图4.2本文神经网络训练曲线5 系统实现与结果分析5.1 系统实现5.1.1 系统实现环境Windows 10目前运行效果较好,现在大多数应用系统都是在这个平台上构建的,同时考虑到应用领域和软件系统的通用性,我们的系统也是基于Windows 10平台运行软件使用Matlab。

5.1.2 系统处理流程图及主要工作图5.1系统处理流程图在整个课题中,主要完成以下工作:1) 通过画图软件获得训练和测试样本(也可以直接选择经过数码相机怕照获得的图像)。

图5.3 试验结果分析从检测结果来看,虽然用于训练的数据集并不是很多,但误差率并不是很高,这也体现了BP算法的优越性,相信如果用更多的数据进行训练会使得正确的检测率提高而错误的检测率降低,从而使网络趋于收敛。

6 结束语介绍了自由手写体数字识别的基本原理和方法,并用MATLAB实现了自由手写体数字识别系统。

在现实生活中,手写体数字识别,尤其是离线手写体数字识别得到了广泛的应用,如银行认证、自动计分等。

通过实验测试,本文设计的系统取得了较好的识别效果并具有良好的抗噪能力。

但是还需要从预处理和特征选择方面做更深入研究,有待进一步提高系统的识别率。

在课题研究过程中,由于时间、精力和条件等因素的限制,对一些问题的研究深度不够,在以下几个方面还需要做进一步研究工作:(l)为了得到更好的识别效率,从特征向量的角度,应该更准确的找到一个方法来提取特征向量,比如投影特征、环凸凹特征等。

(2)如何简化图像预处理,以及针对某些步骤寻找更简单有效的方法,完善某些不甚成熟的地方,从而更好的提高识别率。

参考文献[1]马立权,李维,蔡韩辉,路莹,李歆.手写数字识别中的预处理技术研究. 仪器仪表学报. 第22 卷第3 期增刊.2001[2] 程晨.手写数字识别浅析.科技信息28期.2008[3]杜选,高明峰.人工神经网络在数字识别中的应用.计算机系统应用.2007年第二期[4]曹丹,杨长兴,.手写数字识别的研究进展.电脑知识与技术. Vol.5,No.3,January 2009, pp. 688,695[5] 施少敏,马彦恒陈建泗基于BP神经网络的数字识别方法.网络与信息技术2006, Vol. 25, No. 10[6] 李雪梅.数字识别技术探究电力学报.Vol. 22 No. 3 2007[7] 王克俭 秦臻.基于神经网络的数字识别的研究微电子学与计算.2006 年第23 卷第8 期[8] 马耀名, 黄敏.基于BP神经网络的数字识别研究.信息技术2007年4期[9] 王亚坤,曾德良,李向菊. 一种新颖的数字识别算法.电力科学与工程Jan. 2009Vol.25, No.1[10] 武志强,巨辉,曹世梅. 改进P 神经网络在数字识别上的应用.成都信 息工程学院学报. Vol. 23 No. 6Dec. 2008[11]冯新宇,庞艳辉.车牌识别技术实现方法初探科技与经济.2007年2期[12] 国刚,.应用BP神经网络进行手写体字母数字识别电脑知识与技术.Vol.4,No.6,November 2008, pp.1459-1460,1465[13] L. Lam, S. W. Lee,C.Y.Suen.Thinning Methodologies-AComprehensive Survey.IEEE Transactions on Pattern Analysis and Machine Intelligence,1992,14(9):879[14]马向长.字符识别系统中图像预处理方法的研究.硕士学位论文.北京:北京科技大学,2002[15]周开利,康耀红.神经网络模型及其matlab仿真程序设计.北京:清华大学出版社.2005[16]闻新,周露,李翔,张宝伟.mtalab神经网络仿真与应用.北京:科学出版社.2003[17]王正林,刘明.精通matlab7.0.北京:电子工业出版社.2006[18]飞思科技产品研发中心.matlab6.5辅助图像处理.北京:电子工业出版社.2003[19] 孙兆林.matlab6.x图像处理.北京:清华大学出版社.2002[20] 杜彦蕊,郭连骐,杜海明.手写字符的径向贯穿特征码提取的研究.应用科技,2003,30(4):4~6[21] 手写体数字识别的软件设计.中北大学毕业论文设计致谢论文即将完成,本科生涯即将结束,在此我谨向我的导师赵慧老师致以最衷心的感谢!

在我撰写论文期间,赵老师在学业上给以我悉心的指导,导师宽阔的胸怀、高尚的师德和的人品以及对学生至真至诚的关怀,我将铭记在心,也将是我今后生活、学习的楷模。

特别让我感动和难于忘怀的是那一个一个调试程序、测试程序的时光,虽然充满了困难,但是正是你们的鼓励与支持,才使我坚持了下来。

衷心感谢我的家人,是你们的无私的爱为我创造了一个安心学习的条件。


以上是文章"

5.1.2 系统处理流程图及主要工作图5.1系统处理流程图在整个

"的内容,欢迎阅读超越科技网的其它文章