预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

手写体数字辨认办法研究与实现摘要引言手写体数字辨认是文字辨认中一种研究课题,是近年来研究热点,也是模式辨认领域中最成功应用之一。由于辨认类型较少,在实际生活中有深远应用需求,始终得到广泛注重。近年来随着计算机技术和数字图像解决技术飞速发展,数字辨认在电子商务、机器自动输入等场合已经获得成功实际应用。尽管人们对手写数字研究己从事了很长时间研究,并己获得了诸多成果,但到当前为止,机器辨认本领还无法与人认知能力相比,这仍是一种有难度开放问题,因此对手写数字辨认进一步研究,谋求如何更高效更精确更节能地实现手写数字自动录入和辨认解决方案对提高经济效益、推动社会发展均有深远意义。近年来,人工神经网技术发展十分迅速,它具备模仿人类某些形象思维能力,为模式辨认开辟了新途径,成了模仿人工智能一种重要办法,特别是它信息并行分布式解决能力和自学习功能等明显长处,更是激起了人们对它极大兴趣。BP(BackPropagation)网络是神经网络中一种,是1986年由Rumelhart和McCelland为首科学家小组提出,是一种按误差逆传播算法训练多层前馈网络,可以较好地解决非线性问题,在函数逼近、模式辨认和数据压缩等方面均有很广泛应用。咱们在认真地研究了神经网络基本原理和机制基本上,结合手写体数字辨认这一详细课题,提出了用BP神经网络办法来实现手写体数字辨认方案。手写体数字辨认概述手写数字辨认简述模式辨认是六十年代初迅速发展起来一门学科。由于它研究是如何用机器来实现人及某些动物对事物学习、辨认和判断能力,因而受到了诸多科技领域研究人员注意,成为人工智能研究一种重要方面。字符辨认是模式辨认一种老式研究领域。从50年代开始,许多研究者就在这一研究领域开展了广泛摸索,并为模式辨认发展产生了积极影响。手写体数字辨认是近年来研究热点也是字符辨认中一种特别问题。手写体数字辨认在特定环境下,如邮政编码自动辨认系统,税表和银行支票自动解决系统等普通状况。当涉及到数字辨认时,人们往往规定辨认器有很高辨承认靠性,特别是关于金额数字辨认时,如支票中填写金额某些,更是如此。因而针对此类问题解决系统设计核心环节之一就是设计出高可靠性和高辨认率手写体数字辨认办法。这个领域获得了飞速发展,某些是由于更好学习算法,某些是由于更优良训练集。美国国家科学学会(NIST)建立了一种包括60000个通过标注数字数据库,它已经成为对新学习算法进行比较性能测试原则。然而可以说还没有哪个手写体数字辨认器达到完美辨认效果。在过去数十年中,研究者们提出了许许多多辨认办法,按使用特性不同,这些办法可以分为两类:基于构造特性办法和基于记录特性办法。记录特性普通涉及点密度测量、矩、特性区域等。构造特性普通涉及园、端点、交叉点、笔划、轮廓等,普通来说,两类特性各有优势。例如,使用记录特性分类器易于训练,并且对于使用记录特性分类器,在给定训练集上可以得到相对较高辨认率;而构造特性重要长处之一是能描述字符构造,在辨认过程中能有效地结合几何和构造知识,因而可以得到可靠性较高辨认成果。本文针对手写数字辨认选用BP神经网络这种基于老式记录学基本上分类办法,用于分割和辨认,并获得了较好辨认效果。手写数字辨认普通过程手写体数字辨认过程如图2-1所示,普通分为预解决、特性提取、数字串分割、分类器、等模块。原始图像是通过光电扫描仪,CCD器件或电子传真机等获得二维图像信号。预解决涉及对原始图像去噪、倾斜校正或各种滤波解决。手写体数字具备随意性,其字符大小、字间距、字内距变化很大,分割难度较大。手写数字串分割是其中最重要环节,是制约辨认率瓶颈所在。去噪是预解决中极重要环节。系统面对是从实际环境中切分出字符图像,也许有粘连边框、随机墨点、切分不对的引入其她字符笔划等使前景点增长噪声,还也许有断线等使背景增长噪声,当前适应各种环境通用去噪算法还不成熟。预解决中规格化也不但仅是同比例放缩,它不但要保持拓扑不变,更要最大限度地突出所取特性。在众多应用环境中,特性提取、分类器、多分类器集成是整个辨认系统核心。大体上来说特性可以分为构造特性和记录特性两类。由于分类器选取取决于所提取特性,因而相应辨认办法便有构造办法和记录办法。总之,从手写体数字辨认原理可见,手写体数字辨认技术重要涉及如下几点:1)图像预解决,涉及彩色图像转成灰度图像、二值化,归一化,滤除干扰噪声等;2)基于数字图像特性选取和提取;3)数字串分割;4)模式分类辨认。其中,第二和第四某些是手写数字辨认重点,直接关系到辨认精确率和效率,也是本论文研究重点所在。图2-1辨认流程手写数字辨认普通办法及比较手写数字辨认在学科上属于模式辨认和人工智能范畴。在过去四十年中,人们提出了诸多办法获取手写字符核心特性,提出了许多辨认办法和辨认技术。这些手段分两大类:全局分析和构造分析。近年研究