预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115830599A(43)申请公布日2023.03.21(21)申请号202310077585.6(22)申请日2023.02.08(71)申请人成都数联云算科技有限公司地址610000四川省成都市高新区吉泰五路88号3栋5层8号、9号(72)发明人请求不公布姓名(74)专利代理机构广州三环专利商标代理有限公司44202专利代理师杨子亮(51)Int.Cl.G06V30/10(2022.01)G06V30/19(2022.01)权利要求书3页说明书11页附图7页(54)发明名称工业字符识别方法、模型训练方法、装置、设备和介质(57)摘要本申请实施例公开了一种工业字符识别方法、模型训练方法、装置、设备和介质,属于智能检测领域,该方法通过获取待识别图像,所述待识别图像中包括待识别的字符;将所述待识别图像输入已训练的字符识别模型中,以输出识别出的所述待识别图像中字符的坐标;对识别出的所述字符的坐标进行遍历,以获得字符串列表;基于所述字符串列表,获得字符识别结果。该方法一方面字符识别模型基于带缺陷的字符样本图像训练获得,可以提高对由于缺陷导致字符不清楚的识别率;另一方面,训练集中加入包括多个满足相似度条件的目标字符样本的构造样本图像,添加了易混淆字符样本,训练出的模型可以进一步提高对相似字符的识别率,还可以提高模型训练的收敛速度。CN115830599ACN115830599A权利要求书1/3页1.一种工业字符识别方法,其特征在于,包括:获取待识别图像,所述待识别图像中包括待识别的字符;将所述待识别图像输入已训练的字符识别模型中,以输出识别出的所述待识别图像中字符的坐标;其中,所述字符识别模型基于真实训练样本集和构造训练样本集训练获得,所述真实训练样本集中包括带缺陷的字符样本图像,所述构造训练样本集中包括若干构造样本图像,所述构造样本图像中包括多个满足相似度条件的目标字符样本;对识别出的所述字符的坐标进行遍历,以获得字符串列表;基于所述字符串列表,获得字符识别结果。2.根据权利要求1所述的方法,其特征在于,所述获取待识别图像之前,还包括:获取真实训练样本集和构造训练样本集;利用所述真实训练样本集和所述构造训练样本集对初始字符识别模型进行训练,获得所述字符识别模型。3.根据权利要求2所述的方法,其特征在于,所述获取真实训练样本集和构造训练样本集之前,还包括:从字符库中选取多个满足相似度条件的目标字符样本;其中,所述字符库中包括若干字符样本;从背景库中随机选取一张背景图片:其中,所述背景库中包括若干背景图片;将多个满足相似度条件的所述目标字符样本与一张所述背景图片进行合成,获得一张所述构造样本图像。4.根据权利要求3所述的方法,其特征在于,所述字符库中包括多个目录,各所述目录下分别存储有关于不同字符的且满足相似度条件的字符样本;同一个所述目录下存储有从不同的字符样本图像中提取的关于同一字符的字符样本;所述从字符库中选取多个满足相似度条件的目标字符样本,包括:从所述字符库的不同目录下分别随机选取字符样本,以获得多个满足相似度条件的目标字符样本。5.根据权利要求3所述的方法,其特征在于,所述将多个满足相似度条件的所述目标字符样本与一张所述背景图片进行合成,获得一张所述构造样本图像,包括:采用泊松融合方法,将多个满足相似度条件的所述目标字符样本与一张所述背景图片进行合成,获得一张所述构造样本图像。6.根据权利要求2所述的方法,其特征在于,所述利用所述真实训练样本集和所述构造训练样本集对初始字符识别模型进行训练,获得所述字符识别模型,包括:对所述真实训练样本集中的字符样本图像和所述构造训练样本集中的构造样本图像进行字符标注;利用字符标注后的所述真实训练样本集和字符标注后的所述构造训练样本集对初始字符识别模型进行训练,获得所述字符识别模型。7.根据权利要求1所述的方法,其特征在于,所述识别出的所述待识别图像中的字符包括多个;所述对识别出的所述字符的坐标进行遍历,以获得字符串列表,包括:对识别出的多个所述字符的坐标进行遍历,并根据所述字符的纵坐标对多个所述字符进行分类,获得多个字符串列表;其中,每个字符串列表中包括属于同一横排的多个字符的2CN115830599A权利要求书2/3页坐标;所述基于所述字符串列表,获得字符识别结果,包括:对每个所述字符串列表中的坐标按照横坐标进行排序,获得字符排列顺序;根据所述字符排列顺序,获得字符识别结果。8.一种用于如权利要求1‑7中任一项所述工业字符识别方法中的字符识别模型的模型训练方法,其特征在于,包括:获取真实训练样本集和构造训练样本集;所述真实训练样本集中包括带缺陷的字符样本图像,所述构造训练样本集中包括若干构造样本图像,所述构造样本图像中包括