预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114240783A(43)申请公布日2022.03.25(21)申请号202111548618.8G06N3/08(2006.01)(22)申请日2021.12.17(71)申请人深圳壹账通智能科技有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)(72)发明人蔡壮壮林大权徐亮(74)专利代理机构北京英特普罗知识产权代理有限公司11015代理人程超(51)Int.Cl.G06T5/00(2006.01)G06T3/60(2006.01)G06T7/10(2017.01)G06N3/04(2006.01)权利要求书3页说明书11页附图2页(54)发明名称图片纠正方法、装置、设备和可读存储介质(57)摘要本发明公开了一种图片纠正方法、装置、设备和可读存储介质,该方法包括:获取待纠正图片;对待纠正图片进行分割,生成多个子单元图片;将多个子单元图片输入预先训练完成的图片方向识别模型中,获得图片方向识别模型输出的每个子单元图片的方向标签,统计输出的每个子单元图片的方向标签所属类别,将类别数量最多的方向标签作为待纠正图片的目标方向标签;根据目标方向标签对待纠正图片进行纠正操作,生成标准正向图片。CN114240783ACN114240783A权利要求书1/3页1.一种图片纠正方法,其特征在于,所述方法包括:获取待纠正图片;对所述待纠正图片进行分割,生成多个子单元图片;将多个所述子单元图片输入预先训练完成的图片方向识别模型中,获得所述图片方向识别模型输出的每个子单元图片的方向标签,统计输出的每个子单元图片的方向标签所属类别,将类别数量最多的方向标签作为所述待纠正图片的目标方向标签;根据所述目标方向标签对所述待纠正图片进行纠正操作,生成标准正向图片。2.根据权利要求1所述的方法,其特征在于,在所述将多个所述子单元图片输入预先训练完成的图片方向识别模型中,获得所述图片方向识别模型输出的每个子单元图片的方向标签之前,所述方法还包括:获取第一训练集,其中,所述第一训练集由标准正向图片构成;确定所述标准正向图片的尺寸,判断所述标准正向图片的尺寸是否符合预设标准尺寸,若不符合,则将所述标准正向图片调整至预设标准尺寸;对调整后的标准正向图片进行等比例分割,生成多个尺寸相同的子单元图片,并为每个子单元图片添加0度方向标签,将带有0度方向标签的子单元图片作为第二训练集;将所述第二训练集中的所有子单元图片分别以相同旋转方向旋转90度、旋转180度和旋转270度,并将旋转角度作为每个子单元图片的方向标签,将旋转后带有方向标签的子单元图片作为第三训练集;将所述第二训练集和所述第三训练集中的子单元图片输入初始学习模型进行训练,得到图片方向识别模型。3.根据权利要求2所述的方法,其特征在于,所述初始学习模型通过如下训练方式得到图片方向识别模型:通过所述初始学习模型的第一卷积神经网络分别判断输入的所述第二训练集和所述第三训练集中的子单元图片中文本信息的权重,若所述子单元图片中文本信息的权重大于第一预设阈值,则将所述子单元图片作为第一卷积神经网络的输出;将所述初始学习模型的第一卷积神经网络输出的子单元图片输入至所述初始学习模型的第二卷积神经网络中,通过所述初始学习模型的第二卷积神经网络对输入的子单元图片带有的方向标签进行识别,并输出各子单元图片的方向标签;比对所述初始学习模型的第二卷积神经网络输出的各子单元图片的方向标签与所述第二训练集和所述第三训练集中的子单元图片的方向标签,判断所述初始学习模型的第二卷积神经网络的正确率是否大于第二预设阈值;在所述初始学习模型的第二卷积神经网络的正确率大于第二预设阈值时,则确定所述初始学习模型训练完成,将训练好的初始学习模型作为图片方向识别模型。4.根据权利要求1所述的方法,其特征在于,所述将多个所述子单元图片输入预先训练完成的图片方向识别模型中,获得所述图片方向识别模型输出的每个子单元图片的方向标签,统计输出的每个子单元图片的方向标签所属类别,将类别数量最多的方向标签作为所述待纠正图片的目标方向标签,包括:通过所述图片方向识别模型的第一卷积神经网络的卷积层和池化层接收各个子单元图片,输出各个子单元图片对应的第一特征矩阵和第二特征矩阵;2CN114240783A权利要求书2/3页通过所述图片方向识别模型的第一卷积神经网络的第一全连接层接收所述第一特征矩阵和第二特征矩阵,并计算第一全连接层中的第一类别向量分别与所述第一特征矩阵和第二特征矩阵的乘积,输出所述各个子单元图片文字信息权重的概率得分;将文本信息权重的概率得分大于预设阈值的子单元图片输入图片方向识别模型的第二卷积神经网络的卷积层和池化层,输出各个