预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113850261A(43)申请公布日2021.12.28(21)申请号202111185315.4(22)申请日2021.10.12(71)申请人北京鲸鹳科技有限公司地址100085北京市海淀区双清路甲79号配楼5层A520室(东升地区)(72)发明人岳征宇姜良友张文婷(74)专利代理机构北京市铸成律师事务所11313代理人包莉莉王云红(51)Int.Cl.G06K9/32(2006.01)权利要求书2页说明书10页附图3页(54)发明名称票据OCR的处理方法、装置、设备和计算机可读存储介质(57)摘要本申请提出一种票据OCR的处理方法、装置、设备和计算机可读存储介质,票据OCR的处理方法包括:对目标票据进行OCR识别,得到初始识别结果;按照预设规则对初始识别结果进行关键信息的提取;在关键信息出现缺失的情况下,根据目标票据的关联票据和/或与缺失信息的类型相关的第一数据库,确定缺失信息;在初始识别结果中补充缺失信息,以得到目标识别结果。根据本申请的票据OCR的处理方法,可以有效节省人力,降低用人成本,提高票据识别的效率和准确率。CN113850261ACN113850261A权利要求书1/2页1.一种票据OCR的处理方法,其特征在于,包括:对目标票据进行OCR识别,得到初始识别结果;按照预设规则对所述初始识别结果进行关键信息的提取;在所述关键信息出现缺失的情况下,根据所述目标票据的关联票据和/或与缺失信息的类型相关的第一数据库,确定所述缺失信息;在所述初始识别结果中补充所述缺失信息,以得到目标识别结果。2.根据权利要求1所述的方法,其特征在于,根据所述目标票据的关联票据和/或与缺失信息的类型相关的第一数据库,确定所述缺失信息,包括:按照预设优先级,选择所述关联票据或所述第一数据库,确定所述缺失信息。3.根据权利要求1所述的方法,其特征在于,根据所述目标票据的关联票据和/或与缺失信息的类型相关的第一数据库,确定所述缺失信息,包括:根据所述关联票据确定出第一预选信息及其对应的置信度;根据所述第一数据库确定出第二预选信息及其对应的置信度;根据置信度的大小,从所述第一预选信息和所述第二预选信息中确定出所述缺失信息。4.根据权利要求1所述的方法,其特征在于,按照预设规则对所述初始识别结果进行关键信息的提取,包括:从所述初始识别结果中确定出待选结果;删除所述待选结果中的前后缀内容,以得到所述关键信息;和/或,对所述待选结果进行词组拆分,以得到所述关键信息;和/或,根据与所述待选结果相关的第二数据库,对所述待选结果进行过滤,以得到所述关键信息;和/或,在所述待选结果中包括印章或边框的情况下,进行相应的去印或去框操作,以得到所述关键信息。5.根据权利要求1所述的方法,其特征在于,对目标票据进行OCR识别,包括:根据所述目标票据的类别选择相对应的识别模型;根据所述相对应的识别模型对所述目标票据进行OCR识别。6.根据权利要求1‑5中任一项所述的方法,其特征在于,还包括:基于所述目标识别结果中的各项信息,调用相对应的数据库,以确定出多个指标信息。7.根据权利要求1‑5中任一项所述的方法,其特征在于,还包括:对多个预处理票据进行特征校验,以筛选出所述目标票据。8.一种票据OCR的处理装置,其特征在于,包括:票据识别模块,用于对目标票据进行OCR识别,得到初始识别结果;信息提取模块,用于按照预设规则对所述初始识别结果进行关键信息的提取;缺失信息确定模块,用于在所述关键信息出现缺失的情况下,根据所述目标票据的关联票据和/或与缺失信息的类型相关的第一数据库,确定所述缺失信息;结果确定模块,用于在所述初始识别结果中补充所述缺失信息,以得到目标识别结果。9.根据权利要求8所述的装置,其特征在于,所述缺失信息确定模块还用于按照预设优先级,选择所述关联票据或所述第一数据库,确定所述缺失信息。2CN113850261A权利要求书2/2页10.根据权利要求8所述的装置,其特征在于,所述缺失信息确定模块还用于:根据所述关联票据确定出第一预选信息及其对应的置信度;根据所述第一数据库确定出第二预选信息及其对应的置信度;根据置信度的大小,从所述第一预选信息和所述第二预选信息中确定出所述缺失信息。11.根据权利要求8所述的装置,其特征在于,所述信息提取模块还用于:从所述初始识别结果中确定出待选结果;删除所述待选结果中的前后缀内容,以得到所述关键信息;和/或,对所述待选结果进行词组拆分,以得到所述关键信息;和/或,根据与所述待选结果相关的第二数据库,对所述待选结果进行过滤,以得到所述关键信息;和/或,在所述待选结果中包括印章或边框的情况下,进行相应的去印或去框操作,以得到所述关键信息。12.根据权利要