预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115063807A(43)申请公布日2022.09.16(21)申请号202210613092.5G06V30/414(2022.01)(22)申请日2022.05.31(71)申请人北京开拓鸿业高科技有限公司地址100080北京市海淀区海淀东三街2号13层1301-07(72)发明人刘腾龙(74)专利代理机构北京英创嘉友知识产权代理事务所(普通合伙)11447专利代理师曹寒梅(51)Int.Cl.G06V30/148(2022.01)G06V30/18(2022.01)G06V30/19(2022.01)G06V10/80(2022.01)G06V10/82(2022.01)权利要求书2页说明书12页附图7页(54)发明名称图像处理方法、装置、可读存储介质及电子设备(57)摘要本公开涉及一种图像处理方法、装置、可读存储介质及电子设备。方法包括:获取目标文本图像;根据目标文本图像,生成目标文本图像对应的目标字符置信度分布和目标邻域置信度分布;根据目标字符置信度分布和目标邻域置信度分布,生成目标文本图像对应的至少一个单字符区域。其中,目标字符置信度分布和目标邻域置信度分布,使得目标文本图像中相邻字符之间的区分度较高,从而提升单字符检测的准确度,解决文本图像因形状不规则、字符集和文字表达式丰富、不同文字区域相邻紧凑等因素导致的字符检测难度大的问题。CN115063807ACN115063807A权利要求书1/2页1.一种图像处理方法,其特征在于,包括:获取目标文本图像;根据所述目标文本图像,生成所述目标文本图像对应的目标字符置信度分布和目标邻域置信度分布,其中,所述目标字符置信度分布包括所述目标文本图像中每一像素点位于字符中心的概率,所述目标邻域置信度分布包括每一所述像素点位于字符间隙的概率;根据所述目标字符置信度分布和所述目标邻域置信度分布,生成所述目标文本图像对应的至少一个单字符区域。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标文本图像,生成所述目标文本图像对应的目标字符置信度分布和目标邻域置信度分布,包括:将所述目标文本图像输入到预先训练好的目标置信度预测模型中,得到所述目标文本图像对应的目标字符置信度分布和目标邻域置信度分布。3.根据权利要求2所述的方法,其特征在于,所述目标置信度预测模型包括依次连接的特征提取网络、特征融合网络以及预测模块,所述特征融合网络包括依次连接的第一自顶向下融合单元、自底向上融合单元和第二自顶向下融合单元;其中,所述特征提取网络,用于对所述目标文本图像进行多尺度特征提取,得到多尺度特征图;所述第一自顶向下融合单元,与所述特征提取网络连接,用于对所述多尺度特征图进行自顶向下的特征融合,得到多个第一融合特征图;所述自底向上融合单元,用于对所述多个第一融合特征图进行自底向上的特征融合,得到多个第二融合特征图;所述第二自顶向下融合单元,用于对所述多个第二融合特征图进行自顶向下的特征融合,得到目标融合特征图;所述预测模块,与所述第二自顶向下融合单元连接,用于根据所述目标融合特征图,预测所述目标文本图像对应的目标字符置信度分布和目标邻域置信度分布。4.根据权利要求3所述的方法,其特征在于,所述目标置信度预测模型通过以下方式训练得到:获取第一训练样本,其中,所述第一训练样本包括多个第一合成文本图像、每一所述第一合成文本图像对应的第一样本字符置信度分布和第一样本邻域置信度分布;根据所述第一训练样本,对初始置信度预测模型进行训练,得到中间置信度预测模型;获取第二训练样本,其中,所述第二训练样本包括多个真实文本图像、每一所述真实文本图像对应的第二样本字符置信度分布和第二样本邻域置信度分布;根据所述第二训练样本,对所述中间置信度预测模型进行训练,得到目标置信度预测模型。5.根据权利要求4所述的方法,其特征在于,每一所述真实文本图像对应的第二样本字符置信度分布和第二样本邻域置信度分布通过以下方式来获取:针对每一所述真实文本图像,获取该真实文本图像对应的至少一个样本文字行区域;针对每一所述样本文字行区域,将该样本文字行区域输入到所述中间置信度预测模型中,得到该样本文本行区域对应的预测字符置信度分布和预测邻域置信度分布;根据每一所述样本文本行区域对应的预测字符置信度分布和预测邻域置信度分布,生2CN115063807A权利要求书2/2页成该真实文本图像对应的第二样本字符置信度分布和第二样本邻域置信度分布。6.根据权利要求4所述的方法,其特征在于,所述第一训练样本还包括对每一所述第一合成样本图像进行图像增强处理后所得的第一增强图像以及每一所述第一增强图像对应的第三样本字符置信度分布和第三样本邻域置信度分布;和/或所述第二训练样本还包括对每一所述真实