预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107729954A(43)申请公布日2018.02.23(21)申请号201711019558.4(22)申请日2017.10.27(71)申请人朱秋华地址214000江苏省无锡市锡山区东北塘镇蓉阳村寺庄172号(72)发明人朱秋华(74)专利代理机构北京远智汇知识产权代理有限公司11659代理人徐鹏飞(51)Int.Cl.G06K9/68(2006.01)权利要求书1页说明书6页附图3页(54)发明名称一种文字识别方法、装置、文字识别设备及存储介质(57)摘要本发明实施例公开了一种文字识别方法、装置、文字识别设备及存储介质。所述方法包括:采用轮廓笔画描述作为文字识别的主要文字识别方法;采用边角特征数据库作为辅助的文字识别算法;采用轮廓笔画描述和边角特征数据库作为双识别引擎来识别文字,解决传统文字识别算法无法解决模糊不清的印刷体、变形较多的手写体等文字的识别问题,以提高印刷体、手写体等文字识别的准确率和识别效率。CN107729954ACN107729954A权利要求书1/1页1.一种文字识别方法,其特征在于,包括:采用轮廓笔画描述作为文字识别的主要文字识别方法;采用边角特征数据库作为辅助的文字识别算法;采用轮廓笔画描述和边角特征数据库作为双识别引擎来识别文字。2.根据权利要求1所述的文字识别方法,其特征在于,采用轮廓笔画描述作为文字识别的主要文字识别方法,包括:采用“逆(顺)时针搜索”算法描述所述文字的轮廓;对所述文字的轮廓进行细化处理。3.根据权利要求2所述的文字识别方法,其特征在于,对所述文字的轮廓进行细化处理,包括:使用“切线最陡”算法区分所述文字的轮廓中相邻的两个笔画。4.根据权利要求2所述的文字识别方法,其特征在于,对所述文字的轮廓进行细化处理,包括:采用强制记忆的方法省略所述文字的轮廓中包含的宋体字中笔画起始端带有的三角形的凸出点。5.根据权利要求3所述的文字识别方法,其特征在于,在使用“切线最陡”算法区分所述文字的轮廓中相邻的两个笔画后,还包括:归纳、吞并或省略所述文字的轮廓中的无关大局的“短边”。6.根据权利要求3所述的文字识别方法,其特征在于,在使用“切线最陡”算法区分所述文字的轮廓中相邻的两个笔画后,还包括:把所述文字的轮廓中的曲线描述分解为两条或多条线段,将所述曲线转换为计算机易于操作的对象来处理。7.根据权利要求1所述的文字识别方法,其特征在于,所述采用边角特征数据库作为辅助的文字识别算法,包括:所述边角特征数据库存储改进型的四边轮廓特征;所述改进型的四边轮廓特征在传统的四边轮廓特征法的基础上进行改进,对文字内部进行处理获取细化的文字特征描述。8.一种文字识别装置,其特征在于,包括:主要识别模块,用于采用轮廓笔画描述作为文字识别的主要文字识别方法;辅助识别模块,用于采用边角特征数据库作为辅助的文字识别算法;双引擎识别模块,用于采用轮廓笔画描述和边角特征数据库作为双识别引擎来识别文字。9.一种文字识别设备,其特征在于,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的文字识别方法。10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的文字识别方法。2CN107729954A说明书1/6页一种文字识别方法、装置、文字识别设备及存储介质技术领域[0001]本发明实施例涉及文字识别技术领域,尤其涉及一种文字识别方法、装置、文字识别设备及存储介质。背景技术[0002]通常,人们在看资料时会把自己感兴趣或者重要的内容进行标记。随着通信技术的快速发展,越来越多的人通过社交网络来分享自己感兴趣的内容。[0003]现有的光学字符识别(OCR,OpticalCharacterRecognition)技术可以利用电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字。目前,很多文字识别算法都采用了OCR技术,如游程统计法、X、Y方向归一法、汉字特征法、匹配法、字根特征、粗外围特征法、笔画密度法等算法,但这些算法在识别模糊不清的印刷体、变形较多的手写体时的效果并不理想,准确率也不够高。发明内容[0004]本发明实施例提供一种文字识别方法、装置、文字识别设备及存储介质,以提高印刷体、手写体等文字识别的准确率和识别效率。[0005]本发明实施例提出一种文字识别方法、装置、文字识别设备及存储介质,通过双识别引擎来识别文字,解决传统文字识别算法无法解决模糊不清的印刷体、变形较多的手写体等文字的识别问题,以提高印