票据识别方法、装置、电子设备以及存储介质-豆柴文库

票据识别方法、装置、电子设备以及存储介质.pdf

2023-07-22

10金币

781KB

26页

一只****生物

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共26页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114821603A(43)申请公布日2022.07.29(21)申请号202210211125.3G06N3/08(2006.01)(22)申请日2022.03.03(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人何烩烩王佳阳向宇波(74)专利代理机构北京猷德知识产权代理有限公司16084专利代理师范继晨(51)Int.Cl.G06V30/40(2022.01)G06V10/774(2022.01)G06V10/82(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)权利要求书3页说明书18页附图4页(54)发明名称票据识别方法、装置、电子设备以及存储介质(57)摘要本公开提供了一种票据识别方法、装置、电子设备以及存储介质，涉及深度学习、模式识别领域，可以为：获取待识别的目标票据；分别对多个文本块在目标票据上的二维位置信息进行编码处理，得到多个编码结果；分别对多个编码结果进行图卷积处理，得到多个卷积结果；基于第一条件随机场模型对每个卷积结果进行识别，得到目标票据的文本块级别的第一预测结果，第一条件随机场模型与第二条件随机场模型之间协同训练，第二条件随机场模型用于对每个卷积结果进行识别，以得到目标票据的字级别的第二预测结果。避免了第二条件随机场模型引入的切分误差，在提升第二条件随机场模型的性能的同时，也促进了第一条件随机场模型的预测性能。CN114821603ACN114821603A权利要求书1/3页1.一种票据识别方法，包括：获取待识别的目标票据，其中，所述目标票据包括多个文本块；分别对所述多个文本块在所述目标票据上的二维位置信息进行编码处理，得到多个编码结果，其中，所述多个编码结果与所述多个文本块一一对应；分别对所述多个编码结果进行图卷积处理，得到多个卷积结果，其中，所述多个卷积结果与所述多个编码结果一一对应；基于第一条件随机场模型对每个所述卷积结果进行识别，得到所述目标票据的文本块级别的第一预测结果，其中，所述第一条件随机场模型与第二条件随机场模型协同训练，所述第二条件随机场模型用于对每个所述卷积结果进行识别，以得到所述目标票据的字级别的第二预测结果，所述第一预测结果用于表示所述目标票据中关键字对应的结构化信息。2.根据权利要求1所述的方法，所述编码结果包括每个所述文本块对应的字级别的第一隐藏层向量，基于第一条件随机场模型对每个所述卷积结果进行识别，得到所述目标票据的文本块级别的第一预测结果包括：将字级别的每个所述卷积结果和所述第一隐藏层向量二者之间的和，转换为字级别的第二隐藏层向量；基于所述第二隐藏层向量确定对应的每个所述文本块的第一文本块向量；基于所述第一条件随机场模型对每个所述文本块的第一文本块向量进行识别，得到所述第一预测结果。3.根据权利要求2所述的方法，还包括：基于所述第二条件随机场模型对所述第二隐藏层向量进行识别，得到所述第二预测结果。4.根据权利要求1所述的方法，还包括：基于所述第一条件随机场模型的第一损失函数和所述第二条件随机场模型的第二损失函数，训练得到所述第一条件随机场模型。5.根据权利要求4所述的方法，基于所述第一条件随机场模型的第一损失函数和所述第二条件随机场模型的第二损失函数，训练得到所述第一条件随机场模型，包括：获取所述第一损失函数和所述第二条件随机场模型的第二损失函数二者之和；基于所述和训练得到所述第一条件随机场模型。6.根据权利要求1所述的方法，所述二维位置信息包括每个所述文本块在所述目标票据上的二维坐标值，其中，分别对所述多个文本块在所述目标票据上的二维位置信息进行编码处理，得到多个编码结果包括：确定所述二维坐标值对应的目标坐标向量；对所述目标坐标向量进行编码处理，得到每个所述编码结果。7.根据权利要求6所述的方法，其中，所述二维坐标值包括每个所述文本块的文本框的第一角的第一二维坐标值和第二角的第二二维坐标值，所述第一角和所述第二角位于所述文本框的对角线上，其中，确定所述二维坐标值对应的目标坐标向量，包括：确定所述第一二维坐标值对应的第一坐标向量和所述第二二维坐标值对应的第二坐标向量；将所述第一坐标向量与所述第二坐标向量二者之间的和，确定为所述目标坐标向量。2CN114821603A权利要求书2/3页8.根据权利要求6所述的方法，还包括：基于每个所述文本块的尺寸信息，将所述目标坐标向量的向量维度由原始向量维度调整到目标向量维度，其中，所述目标向量维度大于所述原始向量维度；其中，对所述目标坐标向量进行编码处理，得到每个所述编码结果包括：对所述目标向量维度的所述目标坐标向量进行编码处理，得到每个所述编码结果。9.根据权利要求8所述的方

相关资料

票据识别方法、装置、电子设备以及存储介质.pdf

本公开提供了一种票据识别方法、装置、电子设备以及存储介质，涉及深度学习、模式识别领域，可以为：获取待识别的目标票据；分别对多个文本块在目标票据上的二维位置信息进行编码处理，得到多个编码结果；分别对多个编码结果进行图卷积处理，得到多个卷积结果；基于第一条件随机场模型对每个卷积结果进行识别，得到目标票据的文本块级别的第一预测结果，第一条件随机场模型与第二条件随机场模型之间协同训练，第二条件随机场模型用于对每个卷积结果进行识别，以得到目标票据的字级别的第二预测结果。避免了第二条件随机场模型引入的切分误差，在提升

2023-07-22

781KB

票据识别方法、电子设备、存储介质及装置.pdf

公开了一种票据识别方法、电子设备、存储介质及装置。方法包括：基于每个票据的票面特征建立包括多个识别区域定位模板的票据模板库；识别用户上传的票据图片的票面特征并基于票面特征匹配对应的识别区域定位模板；基于识别区域定位模板对票据图片进行裁切处理获得票据图片的多个图像切片；通过OCR自动识别算法识别每个图像切片中的字段，并筛选出存在重叠的票据字段的图像切片以及OCR自动识别算法无法准确识别的模糊图像切片；对存在重叠的票据字段的图像切片进行过滤处理并提取对应的字段信息；对模糊图像切片建立对应的人工识别派单任务分发

2024-01-09

463KB

票据数据识别方法、电子设备、存储介质及装置.pdf

公开了一种票据数据识别方法、电子设备、存储介质及装置。方法包括：识别用户上传的票据图片的票面特征；基于票面特征从模板库中匹配对应的识别区域定位模板；基于识别区域定位模板对票据图片进行裁切处理，以获得票据图片中对应多个不同区域票据字段的多个图像切片，并使每个图像切片关联一个不同的字段属性；判断每个图像切片中是否存在重叠的票据字段；若图像切片中包括重叠的多个票据字段，则基于图像切片关联的字段属性对多个票据字段进行过滤处理，并只对与字段属性对应的票据字段进行字段信息识别提取，同时将识别提取出的字段信息进行结构化

2024-01-09

408KB

图像的识别方法、装置、存储介质以及电子设备.pdf

本发明公开了一种图像的识别方法、装置、存储介质以及电子设备。该方法包括：获取目标图像，其中，目标图像中包含待分类对象；对目标图像进行数据增强，得到第一图像和第二图像；将第一图像输入至第一识别模型，得到第一输出结果并根据第一输出结果确定目标图像的分类结果，将第二图像输入第二识别模型，得到第二输出结果；获取第一输出结果与第二输出结果的对比结果；在对比结果小于阈值的情况下，输出目标图像的分类结果。本发明解决了训练模型的网络性能低的技术问题。

2023-07-22

468KB

地址识别方法、装置、电子设备以及存储介质.pdf

本公开提供了地址识别方法、装置、电子设备以及存储介质，涉及人工智能、计算机技术领域，尤其涉及知识图谱、深度学习、云计算领域。具体实现方案为：对用于描述事件的待识别内容进行地点实体识别，得到目标地点实体，目标地点实体包括标准化地点实体、别名地点实体和标志性地点实体其中至少之一；针对目标地点实体中每种类型的地点实体，根据地址图谱，确定与地点实体相对应的标准化地址，得到至少一个标准化地址，地址图谱包括标准化地点实体、别名地点实体和标志性地点实体，以及各地点实体之间的对应关系；从至少一个标准化地址中，确定与待识别

2023-07-24

881KB