预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114140802A(43)申请公布日2022.03.04(21)申请号202210111519.1(22)申请日2022.01.29(71)申请人北京易真学思教育科技有限公司地址102200北京市昌平区未来科学城英才北三街16号院16号楼401室(72)发明人秦勇(74)专利代理机构北京开阳星知识产权代理有限公司11710代理人张子青(51)Int.Cl.G06V30/40(2022.01)G06V30/19(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书14页附图5页(54)发明名称一种文本识别方法、装置、电子设备和存储介质(57)摘要本公开涉及一种文本识别方法、装置、电子设备和存储介质。获取目标图像,目标图像包括至少一个字符,通过预先训练的文本识别模型对目标图像中的字符进行识别,文本识别模型包括识别模块和计算模块,其中,通过识别模块对目标图像进行识别,得到目标图像中至少一个字符中每个字符的第一识别结果和目标图像的映射信息;基于计算模块根据第一识别结果和映射信息计算损失值,并根据损失值更新识别模块;通过更新后的识别模块对目标图像进行识别,得到目标图像中至少一个字符中每个字符的第二识别结果,第二识别结果为目标图像的文本识别结果,能够准确的识别图像中的文本,还能够根据目标图像自动调整识别模型的网络参数,识别速度快、准确率高。CN114140802ACN114140802A权利要求书1/3页1.一种文本识别方法,其特征在于,包括:获取目标图像,所述目标图像包括至少一个字符;通过预先训练的文本识别模型对所述目标图像中的字符进行识别,所述文本识别模型包括识别模块和计算模块,其中,通过所述识别模块对所述目标图像进行识别,得到所述目标图像中至少一个字符中每个字符的第一识别结果和所述目标图像的映射信息;基于所述计算模块根据所述第一识别结果和所述映射信息计算损失值,并根据所述损失值更新所述识别模块;通过更新后的识别模块对所述目标图像进行识别,得到所述目标图像中至少一个字符中每个字符的第二识别结果。2.根据权利要求1所述的方法,其特征在于,所述识别模块包括多个识别子模块;所述目标图像的映射信息包括第一映射信息和第二映射信息;所述通过所述识别模块对所述目标图像进行识别,得到所述目标图像中至少一个字符中每个字符的第一识别结果和所述目标图像的映射信息,包括:通过第一识别子模块对所述目标图像进行特征映射,得到第一映射信息;通过第二识别子模块对所述第一映射信息进行特征变换,得到第二映射信息;通过第三识别子模块基于所述第二映射信息,得到所述目标图像中至少一个字符中每个字符的第一识别结果。3.根据权利要求2所述的方法,其特征在于,所述第三识别子模块包括注意力层、循环层和全连接层;所述通过第三识别子模块基于所述第二映射信息,得到所述目标图像中至少一个字符中每个字符的第一识别结果,包括:所述注意力层基于所述第二映射信息,得到第三映射信息;所述循环层基于所述第三映射信息和初始特征向量,得到第一特征向量;所述全连接层基于所述第一特征向量,得到所述目标图像中至少一个字符中每个字符的第一识别结果。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:得到所述第一特征向量后,若不满足所述循环层对应的输出条件,则将所述第一特征向量和所述第三映射信息输入到所述注意力层,得到第四映射信息;将所述第三映射信息与所述第四映射信息合并后的特征信息以及所述第一特征向量输入到所述循环层,得到第二特征向量。5.根据权利要求4所述的方法,其特征在于,所述全连接层基于所述第一特征向量,得到所述目标图像中至少一个字符中每个字符的第一识别结果,包括:得到所述第二特征向量后,若满足所述循环层对应的输出条件,则将所述第二特征向量输入到所述全连接层,得到所述目标图像中至少一个字符中每个字符的第一识别结果。6.根据权利要求1所述的方法,其特征在于,所述计算模块包括多个计算子模块;所述基于所述计算模块根据所述第一识别结果和所述映射信息计算损失值,包括:第一计算子模块基于所述映射信息,得到第一特征信息;第二计算子模块基于所述第一识别结果,得到第二特征信息;第三计算子模块基于预设特征信息,得到第三特征信息;将所述第一特征信息、所述第二特征信息和所述第三特征信息输入到第四计算子模块2CN114140802A权利要求书2/3页计算损失值。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取样本图像,并确定所述样本图像中的字符;构建文本识别模型,所述文本识别模型包括识别模块和计算模块;根据所述样本图像以及所述样本图像中的字符对所述识别