预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116012856A(43)申请公布日2023.04.25(21)申请号202211607231.XG06V30/19(2022.01)(22)申请日2022.12.14G06V10/28(2022.01)G06V10/774(2022.01)(71)申请人山西省信息产业技术研究院有限公G06V10/80(2022.01)司G06V10/82(2022.01)地址030006山西省太原市小店区平阳路42号(72)发明人刘东航申利华上官学奎王志文陆文瑞马瑾男王荣王日中潘炯吉白瑞军文豪(74)专利代理机构太原荣信德知识产权代理事务所(特殊普通合伙)14119专利代理师连慧敏(51)Int.Cl.G06V30/244(2022.01)G06V30/162(2022.01)权利要求书2页说明书5页附图2页(54)发明名称基于多尺度特征融合空洞卷积网络的手写中文识别方法(57)摘要本发明属于识别方法技术领域,具体涉及基于多尺度特征融合空洞卷积网络的手写中文识别方法,使用CASIA‑HWDB1.1数据集作为模型训练与测试数据集;对数据的二值化与归一化处理;对数据标签进行处理,得到One‑Hot形式的数据标签,供网络进行训练;将数据以K折交叉方法划分为多个训练集‑测试集组合;构建识别网络;使用训练集数据对网络进行参数的优化训练;使用K折交叉得到的多个数据集获取最优模型;使用准确率、召回率与F1‑Score对模型进行评价。本发明基于深度神经网络构建了手写字识别模型,模型无需进行人工特征工程,具有更智能化的特征提取能力,可以更加有效的提取数据特征,进行准确率更高的手写汉字识别。CN116012856ACN116012856A权利要求书1/2页1.基于多尺度特征融合空洞卷积网络的手写中文识别方法,其特征在于:包括下列步骤:S1、使用CASIA‑HWDB1.1数据集作为模型训练与测试数据集;S2、对数据的二值化与归一化处理;S3、对数据标签进行处理,得到One‑Hot形式的数据标签,供网络进行训练;S4、将数据以K折交叉方法划分为多个训练集‑测试集组合;S5、构建识别网络;S6、使用训练集数据对网络进行参数的优化训练;S7、使用K折交叉得到的多个数据集获取最优模型;S8、使用准确率、召回率与F1‑Score对模型进行评价。2.根据权利要求1所述的基于多尺度特征融合空洞卷积网络的手写中文识别方法,其特征在于:所述S1中的CASIA‑HWDB1.1数据集共计1176000张图像,所述CASIA‑HWDB1.1数据集由300个人手写而成,其中包含171个阿拉伯数字和特殊符号,3755类GB2312‑80level‑1汉字。3.根据权利要求1所述的基于多尺度特征融合空洞卷积网络的手写中文识别方法,其特征在于:所述S2中对数据的二值化与归一化处理的方法为:读取数据集,将数据集全部数据转换为224*224大小,方便输入网络进行训练与识别;将所有图片转换为黑白二值图,转换方式如下,设定转换阈值,高于阈值的色阶全部设为255,低于阈值的色阶全部设为0,阈值为100,处理方式如下:所述C为转换后色阶,所述ij代表像素点位置,所述i为行,所述j为列,所述c为转换前色阶;将数据读入矩阵,对其进行归一化操作。4.根据权利要求1所述的基于多尺度特征融合空洞卷积网络的手写中文识别方法,其特征在于:所述S3中对数据标签进行处理的方法为:将数据标签进行编号,3755类标签编号为0‑3754,将数据重构为One‑hot形式,所述One‑hot形式3755*1的一维标签,按照其标签编号,在对应位置标位1,其余位置为0。5.根据权利要求1所述的基于多尺度特征融合空洞卷积网络的手写中文识别方法,其特征在于:所述S4中将数据以K折交叉方法划分为多个训练集‑测试集组合的方法为:采用K折交叉验证方式进行数据集的划分,将数据集划分为训练集、验证集与测试集;取K=10,集将全部数据平均分为10个数据集,将其编号为数据集A‑J;在进行模型训练时,选取9个小数据集作为训练集进行模型参数训练,1个小数据及作为测试集对模型识别效果进行评估,构建10个训练集‑测试集组合。6.根据权利要求1所述的基于多尺度特征融合空洞卷积网络的手写中文识别方法,其特征在于:所述S5中构建识别网络的方法为:网络模型基于多尺度特征融合进行构建,并使用空洞卷积对其多个模块进行了特征提取;所述网络模型由4个模块构成,分别为Stem模块、多尺度特征提取模块、全连接模块;所述Stem模块为数据输入网络后最先对数据进行特2CN116012856A权利要求书2/2页征提取的模块,数据输入网络后,首先进行2次卷积核大小为3*3的卷积,之后进行2次卷积核大小为3*3的膨胀卷积,第一