模型训练方法、文本识别方法、装置、设备和介质-豆柴文库

模型训练方法、文本识别方法、装置、设备和介质.pdf

2023-07-25

10金币

828KB

22页

小宏****aa

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共22页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113887535A(43)申请公布日2022.01.04(21)申请号202111464610.3(22)申请日2021.12.03(71)申请人北京世纪好未来教育科技有限公司地址100089北京市海淀区中关村大街32号蓝天和盛大厦1702-03室(72)发明人秦勇(74)专利代理机构北京开阳星知识产权代理有限公司11710代理人唐博(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)权利要求书3页说明书12页附图6页(54)发明名称模型训练方法、文本识别方法、装置、设备和介质(57)摘要本公开涉及模型训练方法、文本识别方法、装置、设备和介质，包括：利用第一训练样本训练第一候选模型中的第一候选分支和第二候选分支，得到训练后的第一目标分支，第一训练样本包括第一文本图像以及第一文本图像对应的文本字符，第二候选分支采用循环神经网络；基于训练后的第一目标分支和第三候选分支构建第二候选模型，并利用第二训练样本训练第二候选模型得到文本识别模型，第二训练样本包括第二文本图像以及第二文本图像对应的文本字符，第三候选分支采用图神经网络，实现快速准确的文本识别。CN113887535ACN113887535A权利要求书1/3页1.一种文本识别模型训练方法，其特征在于，包括：利用第一训练样本训练第一候选模型中的第一候选分支和第二候选分支，得到训练后的第一目标分支，所述第一训练样本包括第一文本图像以及第一文本图像对应的文本字符，所述第二候选分支采用循环神经网络；基于所述训练后的第一目标分支和第三候选分支构建第二候选模型，并利用第二训练样本训练所述第二候选模型得到所述文本识别模型，所述第二训练样本包括第二文本图像以及第二文本图像对应的文本字符，所述第三候选分支采用图神经网络。2.根据权利要求1所述的方法，其特征在于，所述利用第一训练样本训练第一候选模型中的第一候选分支和第二候选分支，得到训练后的第一目标分支，包括：将所述第一训练样本中的第一文本图像输入所述第一候选模型，得到第一预测结果；基于第一预设损失函数，根据所述第一预测结果和所述第一训练样本中的与所述第一文本图像对应的文本字符，对所述第一候选模型中的第一候选分支和第二候选分支进行训练，获得第一候选分支经训练后对应的第一目标分支。3.根据权利要求2所述的方法，其特征在于，所述将所述第一训练样本中的第一文本图像输入所述第一候选模型，得到第一预测结果，包括：通过所述第一候选模型中的第一候选分支对所述第一文本图像进行第一特征提取，得到第一文本图像对应的第一图像特征，其中，所述第一图像特征为经过残差网络提取的特征映射图；通过所述第一候选模型的第二候选分支对所述第一图像特征进行第二特征提取，得到第二图像特征，并对所述第二图像特征进行解码转录，得到第一预测文本字符，其中，所述第二图像特征为经过双向长短期记忆神经网络提取的特征映射图。4.根据权利要求3所述的方法，其特征在于，所述第一候选分支包括残差网络，所述残差网络包括依次串联的N个残差块，其中，N为大于1的正整数；所述通过所述第一候选模型中的第一候选分支对所述第一文本图像进行第一特征提取，得到第一文本图像对应的第一图像特征，包括：拼接前N‑1个残差块输出的特征映射，获得拼接特征映射；将所述拼接特征映射与第N个残差块提取的特征映射进行逐点相加，得到所述第一图像特征。5.根据权利要求3所述的方法，其特征在于，所述第二候选分支包括双向长短期记忆网络、自注意力层和门控循环网络；所述通过所述第一候选模型的第二候选分支对所述第一图像特征进行第二特征提取，得到第二图像特征，并对所述第二图像特征进行解码转录，得到第一预测文本字符，包括：通过所述第二候选分支的双向长短期记忆网络对所述第一图像特征进行第二特征提取，得到与所述第一图像特征对应的第二图像特征；通过所述第二候选分支的自注意力层和门控循环网络对所述第二图像特征进行解码转录，得到第一预测文本字符。6.根据权利要求2所述的方法，其特征在于，所述基于第一预设损失函数，根据所述第一预测结果和所述第一训练样本中的与所述第一文本图像对应的文本字符，对所述第一候选模型中的第一候选分支和第二候选分支进行训练，获得第一候选分支经训练后对应的第2CN113887535A权利要求书2/3页一目标分支，包括：基于第一预设损失函数，根据所述第一预测结果和所述第一训练样本中与所述第一文本图像对应的文本字符，确定第一损失值；根据所述第一损失值调整所述第一候选模型中的第一候选分支的参数和所述第二候选分支的参数，直至第一候选模型收敛，获得所述第一目标分支。7.根据权利要求1所述的方法，其特征在于，所述利用

相关资料

模型训练方法、文本识别方法、装置、设备和介质.pdf

本公开涉及模型训练方法、文本识别方法、装置、设备和介质，包括：利用第一训练样本训练第一候选模型中的第一候选分支和第二候选分支，得到训练后的第一目标分支，第一训练样本包括第一文本图像以及第一文本图像对应的文本字符，第二候选分支采用循环神经网络；基于训练后的第一目标分支和第三候选分支构建第二候选模型，并利用第二训练样本训练第二候选模型得到文本识别模型，第二训练样本包括第二文本图像以及第二文本图像对应的文本字符，第三候选分支采用图神经网络，实现快速准确的文本识别。

2023-07-25

828KB

深度学习模型的训练方法、文本识别方法、装置和设备.pdf

本公开提供了一种深度学习模型的训练方法，涉及人工智能技术领域，尤其涉及深度学习、图像处理和计算机视觉技术领域，可应用于OCR等场景。具体实现方案为：获取样本图像，其中，样本图像设置有标签，标签指示样本图像中的文本信息以及文本信息的语种信息；将样本图像输入到深度学习模型，得到针对多个解码分支的文本识别结果，其中，多个解码分支与多个语种各自对应；根据标签指示的语种信息，从多个解码分支的文本识别结果中确定目标文本识别结果；以及根据标签指示的文本信息与目标文本识别结果之间的差异，调整深度学习模型的参数。本公开还提

2023-07-21

936KB

模型训练方法和目标识别方法、装置、设备及介质.pdf

本发明公开了一种网络匹配模型的训练方法及目标识别方法、装置、设备及介质，由于本发明实施例在对网络匹配模型进行训练时，分别通过第一特征提取网络和第二特征提取网络，获得待检测目标的模板图片和样本图片的第一特征图和第二特征图，根据在样本图片中标注的第一位置信息和在第二特征图中确定的第二位置信息，分别确定第一特征提取网络和第二特征提取网络的参数的参数值，从而使第一特征提取网络和第二特征提取网络，分别学习到模板图片和样本图片的特征，有助于提高两个特征提取网络提取特征的区分度，进而可以对搜索范围进行调整，保证了后续识

2024-01-04

842KB

工业字符识别方法、模型训练方法、装置、设备和介质.pdf

本申请实施例公开了一种工业字符识别方法、模型训练方法、装置、设备和介质，属于智能检测领域，该方法通过获取待识别图像，所述待识别图像中包括待识别的字符；将所述待识别图像输入已训练的字符识别模型中，以输出识别出的所述待识别图像中字符的坐标；对识别出的所述字符的坐标进行遍历，以获得字符串列表；基于所述字符串列表，获得字符识别结果。该方法一方面字符识别模型基于带缺陷的字符样本图像训练获得，可以提高对由于缺陷导致字符不清楚的识别率；另一方面，训练集中加入包括多个满足相似度条件的目标字符样本的构造样本图像，添加了易混

2023-06-07

661KB

文本识别模型训练方法、文本识别方法、装置及电子设备.pdf

本公开涉及一种文本识别模型训练方法、文本识别方法、装置及电子设备。文本识别模型训练方法包括：获取多对第一文本图像；通过多对第一文本图像，以及多对第一文本图像中每对第一文本图像所对应的文本相似度标签，基于对比学习，获得目标特征提取网络；获取多张第二文本图像；通过多张第二文本图像，以及多张第二文本图像中每张第二文本图像所对应的字符序列标注信息，对包括目标特征提取网络和目标编解码网络的初始文本识别模型进行训练，获得目标文本识别模型。本公开提供的文本识别模型训练方法、文本识别方法、装置及电子设备能够提高目标文本识

2023-07-24

1.7MB