预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共45页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本科毕业设计(论文)基于Python的识别图片中文字的工具设计与实现DesignandImplementationofaPythonBasedToolforRecognizingCharactersinPictures院(系)计算机科学与技术学院专业网络工程班级三班学号16210220306学生姓名梁洪森指导教师范波提交日期2020年4月19日毕业设计(论文)原创性声明本人郑重声明:所呈交的毕业设计(论文)是本人在指导老师的指导下独立进行的设计(研究)工作及取得的成果论文中引用他人的文献、数据、图件、资料均已明确标注出论文中的结论和结果为本人独立完成不包含他人已经发表或撰写的作品及成果。对本文的研究作出贡献的个人和集体均已在论文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。毕业论文作者(签字):签字日期:年月日成绩评定成绩项论文成绩(百分制)折合比例实得成绩(折合分)指导教师成绩30%评阅教师成绩20%答辩成绩50%总评成绩注:毕业设计(论文)成绩按百分制评定。答辩成绩不及格的(评分低于60分的)则该毕业设计(论文)总评成绩为答辩成绩。摘要随着时代的发展和计算机的普及现在的资料、文献、档案和书籍都逐渐地变成了数字化的模式但是在此之前已有的纸质资料、文献、档案和书籍的存量十分之多以纸张作为载体来保存这些内容的话存在不少的不方便和安全隐患。纸张是无法再生的纸张一旦损毁了上面所记录的内容也将会丢失而且纸张不方便传播所以把纸质资料转化为电子化的形式是非常有必要的。光学字符识别(Optical Character Recognition OCR)是一种能把印刷在或者写在纸上的内容识别成字符并保存到计算中去的技术在文字录入、书籍电子化这些领域起着至关重要的作用。在OCR进行识别的时候存在着一些影响识别成功率的因素例如图像文件的背景和所识别字符的字体等因素。本文将研究通过图像文件的预处理和训练字库来提升识别的成功率。本次课题所研究的内容主要包括如下内容:(1)开发一个基于Python的OCR工具。(2)通过把图片进行灰度化处理、二值化处理和降噪处理减少图像内背景和非字符的干扰提高识别准确率。(3)训练字库使得开发的OCR工具在提高识别的准确率的同时还能够识别除了一般的印刷字体外其他的字体和字符内容。关键词:OCR技术;信息化;纸质资料;文字录入;灰度化处理;二值化处理AbstractWiththedevelopmentoftheeraandthepopularityofcomputersdataliteraturearchivesandbooksarenowgraduallyturnedintodigitalforms.Butbeforethattherehasbeenagreatnumberofpaperdataliteraturearchivesandbooks.Therearemanyinconveniencesandsecurityrisksinusingpaperasthecarriertopreservethesecontents.Paperisnotregenerated.Oncethepaperisdamagedthecontentsrecordedonitwillbelostandthepaperisnotconvenientforspreadingsoit’snecessarytoconvertpaperdataintoelectronicforms.OpticalCharacterRecognition(OCR)isatechnologythatcanrecognizetheprintedorwrittencontentintocharactersandsavethemtocalculation.Itplaysanimportantroleinthefieldsoftextinputandelectronicbooks.WhenOCRisusedforrecognitiontherearesomefactorsaffectingthesuccessrate