预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114202766A(43)申请公布日2022.03.18(21)申请号202111428606.1G06V30/164(2022.01)(22)申请日2021.11.29G06V30/19(2022.01)G06N3/04(2006.01)(71)申请人航天信息股份有限公司地址100195北京市海淀区杏石口路甲18号航天信息园(72)发明人徐书豪金洪亮闫凯梅俊辉王志刚林文辉高洁(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人于丹(51)Int.Cl.G06V30/412(2022.01)G06V30/414(2022.01)G06V30/42(2022.01)G06V30/146(2022.01)权利要求书2页说明书11页附图7页(54)发明名称一种提取文本字段的方法、装置及电子设备(57)摘要本申请公开一种提取文本字段的方法、装置及电子设备,该方法包括获取包含文本字段的原始图像,并在原始图像中确定出各个目标图像区域,然后对各个目标图像区域中的文本字段进行文本识别,得到各个目标图像区域对应的文本字段,再根据预设提取规则,从文本字段中提取出满足业务需求的目标文本字段。基于上述方法,实现对完税证明图像中的目标文本字段的提取,解决现有技术中无法针对完税证明图像中满足业务需求的目标文本字段进行提取的问题,有效提高提取目标文本字段的准确率。CN114202766ACN114202766A权利要求书1/2页1.一种提取文本字段的方法,其特征在于,所述方法包括:获取包含文本字段的原始图像,在所述原始图像中确定出各个目标图像区域,其中,所述目标图像区域为所述待处理图像中包含所述文本字段的区域;对所述各个目标图像区域中的文本字段进行文本识别,得到所述各个目标图像区域对应的文本字段;根据预设提取规则,从所述文本字段中提取出满足业务需求的目标文本字段。2.如权利要求1所述的方法,其特征在于,所述获取包含文本字段的原始图像,包括:获取包含文本字段的待处理图像;将所述待处理图像按照预设角度进行旋转,得到与所述待处理图像对应的不同旋转角度的N张旋转图像,其中,N为大于等于1的正整数;将所述旋转图像中的文本字段投影在给定方向上,将所述旋转图像在所述给定方向上的投影进行叠加,得到所述旋转图像的投影值,并确定所述N张旋转图像对应的N个投影值;在所述N个投影值中,选择最小的投影值对应的旋转图像,将所述旋转图像作为原始图像。3.如权利要求1‑2任一项所述的方法,其特征在于,在所述获取包含文本字段的原始图像之后,还包括:将所述原始图像划分为多个图像块,其中,所述图像块表征所述原始图像中的部分图像;计算两个图像块之间的欧式距离,并将所述欧式距离小于预设阈值的图像块确定为相似图像块;将所述相似图像块标识为相似区域,得到所述原始图像中一个或多个相似区域;对所述原始图像中的每个相似区域进行去噪处理,得到经过所述去噪处理的原始图像。4.如权利要求1所述的方法,其特征在于,所述在所述原始图像中确定出各个目标图像区域,包括:基于目标检测模型,提取所述原始图像中的图像特征;并根据所述图像特征,确定所述原始图像中的各个目标图像区域。5.如权利要求1所述的方法,其特征在于,所述根据预设提取规则,从所述文本字段中提取出满足业务需求的目标文本字段,包括:基于预设数据库,获取目标文本字段与文本字段之间的关联关系;根据所述关联关系,在所述原始图像中的所述文本字段中提取出满足业务需求的目标文本字段。6.如权利要求1所述的方法,其特征在于,在所述从所述文本字段中提取出满足业务需求的目标文本字段之后,还包括:将所述目标文本字段发送至前端显示界面显示。7.一种提取文本字段的装置,其特征在于,所述装置包括:确定目标图像区域模块,获取包含文本字段的原始图像,在所述原始图像中确定出各个目标图像区域,其中,所述目标图像区域为所述待处理图像中包含所述文本字段的区域;识别文本字段模块,对所述各个目标图像区域中的文本字段进行文本识别,得到所述2CN114202766A权利要求书2/2页各个目标图像区域对应的文本字段;提取目标文本字段模块,根据预设提取规则,从所述文本字段中提取出满足业务需求的目标文本字段。8.如权利要求7所述的装置,其特征在于,所述确定目标图像区域模块,具体用于基于预设数据库,获取目标文本字段与文本字段之间的关联关系;根据所述关联关系,在所述原始图像中的所述文本字段中提取出满足业务需求的目标文本字段。9.一种电子设备,其特征在于,包括:存储器,用于存放计算机程序;处理器,用于执行所述存储器上所存放的计算机程序时,实现权利要求1‑6中任一项所述的方法步骤。10.一种计算机可读存储介质,其特征在于,所述计