预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109740605A(43)申请公布日2019.05.10(21)申请号201811495474.2(22)申请日2018.12.07(71)申请人天津大学地址300072天津市南开区卫津路92号(72)发明人何凯黄婉蓉冯旭高圣楠(74)专利代理机构天津市北洋有限责任专利代理事务所12201代理人李林娟(51)Int.Cl.G06K9/34(2006.01)G06K9/62(2006.01)权利要求书1页说明书8页附图3页(54)发明名称一种基于CNN的手写中文文本识别方法(57)摘要本发明公开了一种基于CNN的手写中文文本识别方法,所述方法将单个手写中文识别与文字分割算法结合起来,实现了手写中文文本的自动识别,所述方法包括以下步骤:对文本图片进行灰度化、二值化处理,再利用直方图投影对中文文本进行分割;先通过横向扫描分割出单行文字,再利用纵向扫描分割出单个文字;对单个中文图片进行扫描处理,对中文进行正射纠正,并使其位于图片中间位置,上下左右各留出10个空白像素;基于TensorFlow框架构造一个包括:4个卷积层、4个池化层和2个全连接层的卷积神经网络,利用训练集进行训练;输入待测图片,根据构建的卷积神经网络进行识别。CN109740605ACN109740605A权利要求书1/1页1.一种基于CNN的手写中文文本识别方法,其特征在于,所述方法将单个手写中文识别与文字分割算法结合起来,实现了手写中文文本的自动识别,所述方法包括以下步骤:对文本图片进行灰度化、二值化处理,再利用直方图投影对中文文本进行分割;先通过横向扫描分割出单行文字,再利用纵向扫描分割出单个文字;对单个中文图片进行扫描处理,对中文进行正射纠正,并使其位于图片中间位置,上下左右各留出10个空白像素;基于TensorFlow框架构造一个包括:4个卷积层、4个池化层和2个全连接层的卷积神经网络,利用训练集进行训练;输入待测图片,根据构建的卷积神经网络进行识别。2.根据权利要求1所述的一种基于CNN的手写中文文本识别方法,其特征在于,所述4个卷积层、4个池化层和2个全连接层的卷积神经网络具体为:layer1为卷积层,采用64个3×3的卷积核对输入图像做卷积,输出64个64×64的特征图像;layer2为池化层,输入layer1的输出图像,池化窗口大小为2×2,步长设为2×2,选择填充方式为SAME,故64个大小为64×64的图像,经layer2计算后输出为64个大小为32×32的特征图像;layer3为卷积层,采用128个3×3的卷积核对layer2的输出图像做卷积,输出是128个大小为32×32的特征图像;layer4为池化层,输入为layer3的输出图像,池化窗口大小为2×2,步长设为2×2,选择填充方式为SAME,故128个大小为32×32的图像,经layer4计算后输出为128个大小为16×16的特征图像;layer5为卷积层,采用256个3×3的卷积核对layer4的输出图像做卷积,输出是256个大小为16×16的特征图像;layer6为池化层,输入为layer5的输出图像,池化窗口大小为2×2,步长设为2×2,选择padding方式为SAME,故256个大小为16×16的图像,经layer6计算后输出为256个大小为8×8的特征图像;layer7为卷积层,采用512个3×3的卷积核对layer6的输出图像做卷积,输出是512个大小为8×8的特征图像;layer8为池化层,输入为layer7的输出图像,池化窗口大小为2×2,步长设为2×2,选择padding方式为SAME;经layer8计算后输出为512个大小为4×4的特征图像;layer9为全连接层,输入为上一层的输出图像,输出为1024个神经元,在进入下一层之前,再次做Dropout处理,Dropout率仍为0.8;layer10为全连接层,输入为layer9的输出,输出为3755个神经元,用于执行最终的识别。3.根据权利要求2所述的一种基于CNN的手写中文文本识别方法,其特征在于,在layer8的输出图像进入下一个网络层之前,为防止网络模型过拟合,先对layer8的输出特征图像做Dropout处理,Dropout率设为0.8。4.根据权利要求2所述的一种基于CNN的手写中文文本识别方法,其特征在于,4个池化层均采用最大池化计算。2CN109740605A说明书1/8页一种基于CNN的手写中文文本识别方法技术领域[0001]本发明涉及计算机图像处理领域,尤其涉及一种基于CNN(卷积神经网络)的手写中文文本识别方法。背景技术[0002]手写中文识别是计算机图像和视觉研究领域的热点之一,在识别历史文档,邮件分类,手写笔记的转录等方