预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113627262A(43)申请公布日2021.11.09(21)申请号202110788604.7G06N3/08(2006.01)(22)申请日2021.07.13(71)申请人深圳力维智联技术有限公司地址518000广东省深圳市南山区粤海街道高新区社区科苑南路3156号深圳湾创新科技中心2栋A座901申请人南京中兴力维软件有限公司(72)发明人薛鹏赵振崇(74)专利代理机构深圳鼎合诚知识产权代理有限公司44281代理人郭燕彭家恩(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)权利要求书2页说明书8页附图2页(54)发明名称文字识别方法、装置及设备(57)摘要一种文字识别方法、装置及设备,通过获取待识别的单个文字的图片;将图片输入至预先训练好的目标识别模型中,得到待识别的单个文字与文字库中的各个文字的相似度,在对目标识别模型进行训练时,采用相似度损失和分类损失确定目标识别模型是否收敛,相似度损失根据第一字形相似度信息和第二字形相似度信息确定,第一字形相似度信息通过目标识别模型得到,第二字形相似度信息通过预设算法得到,分类损失通过预设分类损失函数得到;将待识别的单个文字确定为最大相似度所对应的文字。由于上述损失函数由通过分类损失和判定两个字之间相似度的相似度损失得到,而相似度损失可以使目标识别模型关注文字的整体结构,从而提高了文字识别的准确度。CN113627262ACN113627262A权利要求书1/2页1.一种文字识别方法,其特征在于,所述方法包括:获取待识别的单个文字的图片;将所述图片输入至预先训练好的目标识别模型中,得到所述待识别的单个文字与文字库中的各个文字的相似度;将所述待识别的单个文字确定为最大相似度所对应的文字;其中,训练所述目标识别模型,包括:获取多个样本图片,其中,每个样本图片包括单个文字;将所述每个样本图片输入至初始识别模型中,得到所述每个样本图片包括的单个文字的第一特征向量;通过余弦距离公式,根据所述第一特征向量,计算任意两个所述单个文字的相似度,并对得到的多个相似度进行求和运算,得到第一字形相似度信息;通过预设算法得到第二字形相似度信息,并根据所述第一字形相似度信息和所述第二字形相似度信息,得到相似度损失;根据所述相似度损失和分类损失,确定组合损失,其中,所述分类损失通过预设分类损失函数得到;根据所述组合损失,对所述初始识别模型的参数进行调整,以得到更新的识别模型;针对所述更新的识别模型,迭代上述训练过程,直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别模型作为所述目标识别模型。2.如权利要求1所述的方法,其特征在于,所述通过预设算法得到第二字形相似度信息,包括:分别将任意两个样本图片缩放至预设尺寸;分别对缩放后的样本图片进行划分,得到每个样本图片包括的单个文字的第二特征向量;通过余弦距离公式,根据所述第二特征向量,计算任意两个所述单个文字的相似度,并对得到的多个相似度进行求和运算,得到第二字形相似度信息。3.如权利要求2所述的方法,其特征在于,在所述分别将任意两个样本图片缩放至预设尺寸之前,所述方法还包括:分别对任一样本图片进行裁切,以使所述单个文字与裁切后的样本图片边框的距离小于第二预设阈值。4.如权利要求1所述的方法,其特征在于,所述相似度损失通过下述公式得到:其中,N为样本图片的数量,Loss_Sim为所述相似度损失,Sim_gt为所述第二字形相似度信息,Sim_pd为所述第一字形相似度信息。5.如权利要求4所述的方法,其特征在于,所述组合损失通过下述公式得到:2CN113627262A权利要求书2/2页其中,Loss为所述组合损失,Loss_Cls为所述分类损失。6.如权利要求1所述的方法,其特征在于,所述预设分类损失函数为交叉熵损失函数。7.一种文字识别装置,其特征在于,所述装置包括:第一获取模块,用于获取待识别的单个文字的图片;第二获取模块,用于将所述图片输入至预先训练好的目标识别模型中,得到所述待识别的单个文字与文字库中的各个文字的相似度;确定模块,用于将所述待识别的单个文字确定为最大相似度所对应的文字;训练模块,用于获取多个样本图片,其中,每个样本图片包括单个文字;将所述每个样本图片输入至初始识别模型中,得到所述每个样本图片包括的单个文字的第一特征向量;通过余弦距离公式,根据所述第一特征向量,计算任意两个所述单个文字的相似度,并对得到的多个相似度进行求和运算,得到第一字形相似度信息;通过预设算法得到第二字形相似度信息,并根据所述第一字形