预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113836878A(43)申请公布日2021.12.24(21)申请号202111026974.3(22)申请日2021.09.02(71)申请人北京来也网络科技有限公司地址100080北京市海淀区丹棱路3号中国电子大厦19层1902申请人来也科技(北京)有限公司(72)发明人黄安汪冠春胡一川褚瑞李玮(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人罗岚(51)Int.Cl.G06F40/174(2020.01)G06F40/18(2020.01)G06K9/32(2006.01)权利要求书4页说明书11页附图7页(54)发明名称结合RPA和AI的表格生成方法、装置、电子设备及存储介质(57)摘要本公开提供了一种结合RPA和AI的表格生成方法、装置、电子设备及存储介质,涉及人工智能领域。该方案为:由RPA系统执行,RPA系统从图像中基于人工智能AI提取第一表格的横线和竖线;RPA系统获取横线与竖线的交点集合,其中,交点集合中包括由横线和竖线相交而成的第一类交点,以及横线的延长线和/或竖线的延长线相交而成的第二类交点;RPA系统根据交点集合生成与第一表格一致的空白的第二表格;RPA系统将从图像中基于OCR识别出的文本条目,填充至空白的第二表格中,得到目标表格。本公开运用RPA技术,识别图片中的表格,并将其还原为拥有相同表格结构的表格文档,自动地将线下数据转化为线上数据,取代了繁琐的人工处理流程,提高了表格生成的效率。CN113836878ACN113836878A权利要求书1/4页1.一种结合RPA和AI的表格生成方法,其特征在于,由RPA系统执行,所述方法包括:所述RPA系统从图像中基于人工智能AI提取第一表格的横线和竖线;所述RPA系统获取所述横线与所述竖线的交点集合,其中,所述交点集合中包括由所述横线和所述竖线相交而成的第一类交点,以及所述横线的延长线和/或所述竖线的延长线相交而成的第二类交点;所述RPA系统根据所述交点集合生成与所述第一表格一致的空白的第二表格;所述RPA系统将从所述图像中基于光学字符识别ORC识别出的文本条目,填充至所述空白的第二表格中,得到目标表格。2.根据权利要求1所述的方法,其特征在于,所述RPA系统根据所述交点集合生成与所述第一表格一致的空白的第二表格,包括:所述RPA系统根据所述交点集合中的交点对单元进行枚举,获取候选单元格和所述候选单元格的属性信息;所述RPA系统根据所述候选单元格的属性信息,从所述候选单元格中识别用于生成所述空白的第二表格的目标单元格;所述RPA系统对所述目标单元格按照位置排布生成所述空白的第二表格。3.根据权利要求2所述的方法,其特征在于,所述RPA系统根据所述候选单元格的属性信息,从所述候选单元格中识别用于生成所述空白的第二表格的目标单元格,包括:所述RPA系统对枚举的所有候选单元格,按照单元格面积从小到大进行排序;所述RPA系统按序对所述候选单元格进行遍历,对遍历到的目标候选单元格的存在性进行判断;所述RPA系统每当判断出所述目标候选单元格存在,则从未遍历到的所述候选单元格中删除与所述目标候选单元格存在重叠的单元格,并将判断出存在的所述目标候选单元格确定为一个所述目标单元格;所述RPA系统对删除后未遍历到的所述候选单元格继续按序遍历,直至遍历结束得到所有的所述目标单元格。4.根据权利要求3所述的方法,其特征在于,所述RPA系统按序对所述候选单元格进行遍历,对遍历到的目标候选单元格的存在性进行判断,包括:所述RPA系统获取所述目标候选单元格对应的所述横线的第一起终点和所述竖线的第二起终点;所述RPA系统根据所述目标候选单元格的四角坐标、所述第一起终点和所述第二起终点,判断所述目标候选单元格的四条边是否均存在;所述RPA系统在判断出所述四条边均存在时,确定所述目标候选单元格存在。5.根据权利要求2‑4任一项所述的方法,其特征在于,所述RPA系统根据所述候选单元格的属性信息,从所述候选单元格中识别用于生成所述空白的第二表格的目标单元格之前,还包括:所述RPA系统将所述交点集合中的交点进行顺序排列,并按照同一方向将交点集合中相邻的交点,组成多个交点对;所述RPA系统按照所述同一方向依次获取相邻的所述交点对,并由所述相邻的所述交点对组成基础单元格;2CN113836878A权利要求书2/4页所述RPA系统将所述基础单元格作为矩阵元素,构建布尔矩阵。6.根据权利要求5所述的方法,其特征在于,所述RPA系统对所述目标单元格按照位置排布生成所述空白的第二表格,包括:所述RPA系统根据所述目标单元格对所述布尔矩阵中每个所述矩阵元素进行赋值,以生成目标布尔矩阵;所述RPA系统识别所述