预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110232375A(43)申请公布日2019.09.13(21)申请号201810193965.5(22)申请日2018.03.05(71)申请人重庆邮电大学地址400065重庆市南岸区崇文路2号重庆邮电大学(72)发明人朴昌浩邵慧爽林松(51)Int.Cl.G06K9/20(2006.01)G06K9/46(2006.01)G06K9/72(2006.01)H04L29/06(2006.01)权利要求书1页说明书3页附图1页(54)发明名称一种端到端的空心验证码识别方法(57)摘要本发明发明了一种端到端的空心验证码识别方法,步骤为:A、对扭曲粘连的空心验证码进行预处理,去干扰,获得只含有字符的实心验证码;B、设计卷积神经网络模型,训练预处理后已知标签的整张黑白验证码的模型;C、利用步骤B的卷积神经网络模型,对未知标签的验证码进行识别。本发明提供的技术方案简单实用,能及时的对背景有图像干扰的空心验证码进行预处理,去除背景干扰,保留验证码的有效字符。本技术方案不涉及字符分割,对扭曲粘连的验证码有较高的识别率,增加了验证码识别的统一性。CN110232375ACN110232375A权利要求书1/1页1.一种端到端的空心验证码识别方法,其作用在于识别扭曲粘连的空心验证码,不需要对字符进行分割,其步骤如下:A.对扭曲粘连空心验证码进行预处理,去干扰,获得只含有字符的实心验证码;B.设计卷积神经网络模型,训练预处理后已知标签的整张黑白验证码的模型;C.利用步骤B的卷积神经网络模型,对未知标签的验证码进行识别。2.根据权利要求1所述的空心验证码识别方法,其特征在于,步骤A中的预处理和去除背景干扰的步骤包括:A1、空心验证码二值化后,对出现轮廓线断裂的字符,进行断点查找、匹配、连接;A2、对验证码四边紧邻的所有封闭区域进行颜色填充,填充为黑色,对剩余白色区域按照灰度值依次增加一定数值的规律进行颜色填充;A3、根据颜色块中像素点个数小于阀值以及颜色块长宽比特性去除部分干扰块;A4、根据剩余颜色块的字符特性和有效字符块相邻边界灰度值相差一定值的特性,对断裂的字符块进行修复。3.根据权利要求1所述的空心验证码识别方法,其特征在于:步骤B中的设计卷积神经网络模型的步骤包括设计卷积神经网络的层数、卷积核大小;将预处理后已知标签的整张黑白验证码作为训练集,进行训练,调整参数,获取其中最优的卷积神经网络的模型参数。4.根据权利要求1所述的空心验证码识别方法,其特征在于:步骤C中对未知标签的验证码识别部分步骤包括首先将未知标签的验证码进行预处理,去干扰,获得实心的黑白验证码;随后,将此整张验证码输入到卷积神经网络模型,对整张验证码进行识别。2CN110232375A说明书1/3页一种端到端的空心验证码识别方法技术领域[0001]本发明涉及图像识别领域,具体涉及一种端到端的空心验证码识别方法。背景技术[0002]验证码(CAPTCHA)是一种用来防止恶意程序在互联网上滥用资源的安全机制。被广泛应用于互联网注册、登录和验证等环节,以保证网站稳定性和安全性。一个良好的验证码应具备健壮性和良好的用户体验,人类识别率达到80%,而机器识别率1%。文本型的空心验证码作为一种目前广泛应用的验证码,常由扭曲粘连的数字或英文字母的轮廓线组成。相对早先的实心字符,含有少量的字符特征信息,被应用于各大互联网公司。[0003]目前对于验证码识别的研究,主要包括三部分,即预处理、字符分割、识别。扭曲粘连的空心验证码增加了去干扰和分割的难度,且目前没有统一的字符分割技术。为此,本发明提出了一种无需对验证码进行分割的识别方法,即一种端到端的空心验证码识别方法。发明内容[0004]针对以上技术背景中的问题,本发明提出无需对验证码进行字符分割的识别方法,即一种端到端的空心验证码识别方法。[0005]进一步技术方案如下:[0006]本发明提供了一种端到端的空心验证码识别方法。该方法主要包括:对空心验证码进行预处理,去干扰,获得只含有字符的实心验证码;设计卷积神经网络模型,训练预处理后已知标签的整张黑白验证码的模型。利用获得的训练模型,对未知标签的验证码进行识别。[0007]所述对空心验证码进行预处理,去干扰,获得只含有字符的实心验证码部分,首先对验证码进行灰度化、二值化。对空心验证码中出现轮廓线断裂的字符,进行断点查找、匹配和连接。接着,对验证码四边相邻的所有封闭区域进行颜色填充,填充为黑色。对剩余的区域按照灰度值依次增加20的顺序规律,使用种子填充算法对连通域填充,此时干扰图案变成了干扰块。根据颜色块中像素点个数小于阀值以及根据颜色块长宽比特性去除部分干扰块。判断剩余颜色块的字符特性,对发生粘连的有效字符颜色