预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114170451A(43)申请公布日2022.03.11(21)申请号202111466431.3(22)申请日2021.12.03(71)申请人京东科技信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼6层601(72)发明人王前勇(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人张效荣韩黎捷(51)Int.Cl.G06V10/74(2022.01)G06V30/19(2022.01)G06K9/62(2022.01)权利要求书2页说明书10页附图4页(54)发明名称一种文本识别方法和装置(57)摘要本发明公开了一种文本识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:使用文字识别模型对图片进行文字识别处理得到初步识别结果;将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。该实施方式实现了将文字识别的初步识别结果与预设的文本集合列表进行相似度比较,以对初步识别结果进行修正,提高了相似文本的识别准确率,保证了文本识别结果的可靠性,从而更好的应用于实际场景。CN114170451ACN114170451A权利要求书1/2页1.一种文本识别方法,其特征在于,包括:使用文字识别模型对图片进行文字识别处理得到初步识别结果;将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。2.根据权利要求1所述的方法,其特征在于,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:将所述初步识别结果划分为:中文字符结果集合、外文字符结果集合和数字结果集合;将所述初步识别结果与预设的文本集合列表进行相似度比较包括:将所述中文字符结果集合、外文字符结果集合和数字结果集合,分别与预设的文本集合列表进行相似度比较。3.根据权利要求1所述的方法,其特征在于,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:确认所述初步识别结果包括的文本字符个数满足设定要求。4.根据权利要求1所述的方法,其特征在于,将所述初步识别结果与预设的文本集合列表进行相似度比较包括:将所述初步识别结果以文本行为单位,分别与预设的文本集合列表中的每行文本进行相似度比较。5.根据权利要求4所述的方法,其特征在于,所述满足要求的目标文本列表包括:与所述初步识别结果的文本行完全相同的所述文本集合列表中的文本;与所述初步识别结果的文本行具有文字包含关系的所述文本集合列表中的文本;与所述初步识别结果的文本行的字符相似度满足设定相似度阈值的所述文本集合列表中的文本。6.根据权利要求1所述的方法,其特征在于,所述文本集合列表是通过对即将使用到的文本集合,以行为单位进行预处理得到的,且所述文本集合列表中的每行文本具有次数属性;将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表包括:将所述初步识别结果中的每个文本行分别与预设的文本集合列表进行相似度比较,得到所述每个文本行对应的目标文本;对每个文本行,获取对应的目标文本的次数属性值;对于所述初步识别结果中重复的文本行,若所述文本行的相似度比较次数与对应的目标文本的次数属性值相等,则将所述目标文本作为所述文本行对应的目标文本添加到目标文本列表中;否则,不添加到目标文本列表中。7.根据权利要求6所述的方法,其特征在于,还包括:对于所述初步识别结果中的文本行,在未得到与所述文本行对应的目标文本的情况下,将所述文本集合列表中与所述文本行相似度最高的文本按照预设格式进行汇总,并确认是否添加到所述文本集合列表中。2CN114170451A权利要求书2/2页8.一种文本识别装置,其特征在于,包括:初步识别结果获取模块,用于使用文字识别模型对图片进行文字识别处理得到初步识别结果;文本对比模块,用于将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;文本修正模块,用于根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。9.一种移动电子设备终端,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑7中任一所述的方法。10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1‑7中任一所述的方法。3CN114170451A说明书1/10页一种文本识别方