预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

自由手写体数字辨认系统设计与实现摘要:本文阐述并设计实现了一种脱机自由手写体数字辨认系统。文中一方面对待辨认数字预解决进行了简介,涉及二值化、平滑滤波、规范化、细化等图像解决办法;另一方面,探讨了如何提取数字字符构造特性和笔划特性,并详细地描述了知识库构造办法;最后采用了以知识库为基本模板匹配辨认办法,并以MATLAB作为编程工具实现了具备和谐图形顾客界面自由手写体数字辨认系统。实验成果表白,本办法具备较高辨认率,并具备较好抗噪性能。核心词:手写体数字;预解决;模式辨认;特性提取Abstrct:Thispaperdescribesanddesignsafreehandwrittennumberrecognitionsystem.Firstly,thepretreatmentofthecharactertoberecognizedisintroduced,includingbinarization,smoothing,normalizationandthinning.Next,howtoextractthestructuralfeaturesofthenumbersisdiscussed,andwedescribetheconstructingmethodofrepository.Finally,weusethemethodoftemplatematching,basedonrepository,torecognizethedigitalnumber.Matlabisusedasaprogramtooltorealizethisfreehandwrittendigitalrecognitionsystemwithfriendlygraphicaluserinterface.Theexperimentalresultsshowthattherateoftherecognitionsystemishigh,andtheproposedmethodisrobusttonoise.Keywords:handwrittennumber;pretreatment;patternrecognition;featureextraction1引言OCR(OpticalCharacterRecognition)即光学字符辨认技术,是通过扫描仪把印刷体或手写体文稿扫描成图像,然后辨认成相应计算机可直接解决字符。OCR是模式辨认一种分支,按字体分类重要分为印刷体辨认和手写体辨认两大类。对于印刷体辨认又可以提成单一字体单一字号和各种字体各种字号几类。而手写体辨认又可分为受限手写体和不受限手写体两类;按辨认方式可分为在线辨认和脱机辨认两类。字符辨认解决信息可分为两大类:一类是文字信息,解决重要是用各国家、各民族文字(如:中文,英文等)书写或印刷文本信息,当前在印刷体和联机手写方面技术已趋向成熟,并推出了诸多应用系统;另一类是数据信息,重要是由阿拉伯数字及少量特殊符号构成各种编号和记录数据,如:邮政编码、记录报表、财务报表、银行票据等等,解决此类信息核心技术是手写数字辨认。因而,手写数字辨认研究有着重大现实意义,一旦研究成功并投入应用,将产生巨大社会和经济效益。在整个OCR领域中,最为困难就是脱机自由手写字符辨认。到当前为止,尽管人们在脱机手写英文、中文辨认研究中已获得诸多可喜成就,但距离实用尚有一定距离。而在手写数字辨认这个方向上,通过近年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据高速自动输入提供了一种解决方案。本文一方面简介了自由手写体数字辨认基本原理,涉及数字图像预解决、特性提取和模式辨认基本原理和办法;另一方面简介了;最后通过基于MATLAB实验成果,对本系统性能进行了分析。2手写体数字辨认基本原理本系统重要由手写体数字辨认训练过程和辨认过程构成,训练过程和辨认过程均涉及预解决、特性提取和模式辨认三某些。系统构成如图2.1所示。辨认过程训练过程数据采集,预解决特性提取与选取分类辨认数据采集,预解决分类辨认改进数据采集,预解决改进分类辨认待识对象训练样本人工干预特性提取与选取改进特性提取与选取对的率测试SHAPE\*MERGEFORMAT图2.1系统流程图下面分别简介各某些工作基本原理。2.1预解决预解决重要由二值化,平滑去噪,规范化,细化等构成。本文采用了基于阈值二值化算法,通过最大类间方差法即OTSU办法,记录图像灰度直方图选用全局阈值,然后进行二值化解决。另一方面,在二值化后运用均值滤波办法消除孤立点、线噪声,这样图中就只剩余手写体数字。在滤波中本文采用是3*3大小模板。平滑去噪后,对图像进行规范化解决。找出图像中数字边界,然后提取出数字把它居中放置在正方形方框中,再对此正方形图像进行线性插值缩放,使它变为统一规格大小图像,