预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111444795A(43)申请公布日2020.07.24(21)申请号202010177540.2(22)申请日2020.03.13(71)申请人安诚迈科(北京)信息技术有限公司地址100096北京市海淀区建材城中路3号楼6层中段608室(72)发明人孟波川黄煦李建(74)专利代理机构北京思创大成知识产权代理有限公司11614代理人张立君(51)Int.Cl.G06K9/00(2006.01)G06K9/32(2006.01)G06K9/34(2006.01)G06K9/62(2006.01)权利要求书2页说明书6页附图1页(54)发明名称票据数据识别方法、电子设备、存储介质及装置(57)摘要公开了一种票据数据识别方法、电子设备、存储介质及装置。方法包括:识别用户上传的票据图片的票面特征;基于票面特征从模板库中匹配对应的识别区域定位模板;基于识别区域定位模板对票据图片进行裁切处理,以获得票据图片中对应多个不同区域票据字段的多个图像切片,并使每个图像切片关联一个不同的字段属性;判断每个图像切片中是否存在重叠的票据字段;若图像切片中包括重叠的多个票据字段,则基于图像切片关联的字段属性对多个票据字段进行过滤处理,并只对与字段属性对应的票据字段进行字段信息识别提取,同时将识别提取出的字段信息进行结构化数据输出。能够通过对票据图片进行裁切处理,并基于字段属性定义识别,实现提高识别精确度与效率。CN111444795ACN111444795A权利要求书1/2页1.一种票据数据识别方法,其特征在于,包括:识别用户上传的票据图片的票面特征;基于所述票面特征从模板库中匹配对应的识别区域定位模板;基于所述识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中对应多个不同区域票据字段的多个图像切片,并使每个图像切片关联一个不同的字段属性;判断每个图像切片中是否存在重叠的票据字段;其中,若所述图像切片中只有单一的票据字段,则直接对所述切片图像中的票据字段进行字段信息识别提取,同时将识别提取出的字段信息进行结构化数据输出;若所述图像切片中包括重叠的多个票据字段,则基于所述图像切片关联的字段属性对所述多个票据字段进行过滤处理,并只对与所述字段属性对应的票据字段进行字段信息识别提取,同时将识别提取出的字段信息进行结构化数据输出。2.根据权利要求1所述的票据数据识别方法,其特征在于,识别所述票据图片的票面特征包括:对所述票据图片进行校正处理,获得校正后的票据图片;识别所述票据图片的票据类别信息以及所属单位信息。3.根据权利要求1所述的票据数据识别方法,其特征在于,基于所述票面特征从模板库中匹配对应的识别区域定位模板包括:基于所述票据图片的票据类别信息以及所属单位信息从所述模板库中匹配对应的识别区域定位模板。4.根据权利要求3所述的票据数据识别方法,其特征在于,所述识别区域定位模板包括对应所述票据图片的中多个必要的票据字段所在位置的多个框选识别区域,其中每个所述框选识别区域对应不同的字段属性。5.根据权利要求4所述的票据数据识别方法,其特征在于,基于所述识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中多个不同票据字段的多个图像切片,并使每个图像切片关联一个不同的字段属性包括:基于所述识别区域定位模板中的所述多个框选识别区域对所述票据图片进行裁切处理,以获得与所述多个框选识别区域一一对应的多个图像切片,并使每个所述图像切片与对应的一个框选识别区域的所述字段属性进行关联。6.根据权利要求4所述的票据数据识别方法,其特征在于,基于所述识别区域定位模板对所述票据图片进行裁切处理还包括:判断所述票据图片中与所述识别区域定位模板中多个所述框选识别区域对应的每个票据字段是否倾斜或模糊;若所述票据字段倾斜或模糊,则将该票据字段对应的框选识别区域进行扩大处理,并基于扩大处理后的框选识别区域对该票据字段进行裁切处理。7.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6任一所述的票据数据识别方法。2CN111444795A权利要求书2/2页8.一种非暂态计算机可读存储介质,其特征在于,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1-6任一所述的票据数据识别方法。9.一种票据数据识别装置,其特征在于,包括:模板库,所述模板库包括对应多种不同票据图片的识别区域定位模板;模板匹配模块,用于识别用户上传的票据图片的票面特征,并基于所述票面特征从模板库中匹配对应的识别