预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111428700A(43)申请公布日2020.07.17(21)申请号202010522622.6(22)申请日2020.06.10(71)申请人上海交通大学苏州人工智能研究院地址215000江苏省苏州市苏州工业园区新平街388号13幢(72)发明人梁宇舒(74)专利代理机构北京品源专利代理有限公司11332代理人孟金喆(51)Int.Cl.G06K9/00(2006.01)G06K9/46(2006.01)权利要求书2页说明书10页附图4页(54)发明名称表格识别方法、装置、电子设备、存储介质(57)摘要本申请公开了一种表格识别方法、装置、电子设备、存储介质,该方法包括:提取待识别表格包含的交点,根据待识别表格的表格边上的交点之间的距离确定网格的尺寸,根据网格对待识别表格进行划分,使每个网格最多包含一个交点,且每个网格的相邻网格不包含交点;查找先验交点所在的目标网格,统计目标网格以及目标网格的相邻网格在目标方向上包含的网格中的目标交点数量;根据目标交点数量确定是否保留目标网格在目标方向线段;根据保留的目标方向线段生成目标表格。根据交点数量确定目标网格在目标方向上是否存在线段,进而准确的识别出待识别表格中先验交点关联的表格线段,提高表格识别鲁棒性。CN111428700ACN111428700A权利要求书1/2页1.一种表格识别方法,其特征在于,包括:提取待识别表格包含的交点,所述待识别表格包括第一方向的线段和第二方向的线段,第一方向的线段和第二方向的线段相交,所述交点为第一方向的线段与第二方向的线段相交的点;根据所述待识别表格的表格边上的交点之间的距离确定网格的尺寸,根据所述网格对所述待识别表格进行划分,使每个网格最多包含一个交点,且每个网格的相邻网格不包含交点;查找先验交点所在的目标网格,统计所述目标网格以及所述目标网格的相邻网格在目标方向上包含的网格中的目标交点数量,所述先验交点为预设待识别区域的区域顶点,所述目标方向包括所述第一方向或所述第二方向;根据所述目标交点数量确定是否保留所述目标网格在所述目标方向线段;根据保留的目标方向线段生成目标表格。2.根据权利要求1所述的表格识别方法,其特征在于,所述提取待识别表格包含的交点,包括:提取待识别表格中第一方向的线段和第二方向的线段;将所述第一方向的线段和所述第二方向的线段进行与操作,确定交点。3.根据权利要求1所述的表格识别方法,其特征在于,在提取待识别表格包含的交点之后,还包括:根据所述交点的位置信息确定所述待识别表格的四个顶点;根据所述四个顶点的位置信息对所述交点和所述顶点进行透视变换,所述透视变换用于将所述顶点和所述交点的分布校正为预设几何图形的坐标关系。4.根据权利要求1所述的表格识别方法,其特征在于,所述根据所述待识别表格的表格边上的交点之间的距离确定网格的尺寸,包括:分别获取所述待识别表格的各表格边上的交点;分别计算各表格边上交点之间的最短距离;根据所述最短距离确定网格的尺寸。5.根据权利要求4述的表格识别方法,其特征在于,所述根据所述最短距离确定网格的尺寸,包括:根据所述最短距离的预设倍数确定网格的尺寸,所述预设倍数小于二分之一。6.根据权利要求1所述的表格识别方法,其特征在于,所述统计所述目标网格以及所述目标网格的相邻网格在目标方向上包含的网格中的目标交点数量,包括:统计所述目标网格在目标方向上包含的网格中的第一交点数量;在目标方向的相交方向获取所述目标网格在预设距离内的相邻网格,分别统计所述相邻网格在所述目标方向上包含的网格中的第二交点数量;根据第一交点数量和第二交点数量的总和确定目标交点数量。7.根据权利要求1所述的表格识别方法,其特征在于,根据所述目标交点数量确定是否保留所述目标网格在所述目标方向线段,包括:如果所述目标交点数量大于等于阈值,则保留所述目标网格在所述目标方向线段;如果所述目标交点数量小于阈值,则取消保留所述目标网格在所述目标方向线段。2CN111428700A权利要求书2/2页8.一种表格识别装置,其特征在于,包括:交点提取模块,用于提取待识别表格包含的交点,所述待识别表格包括第一方向的线段和第二方向的线段,第一方向的线段和第二方向的线段相交,所述交点为第一方向的线段与第二方向的线段相交的点;网格划分模块,用于根据所述待识别表格的表格边上的交点之间的距离确定网格的尺寸,根据所述网格对所述待识别表格进行划分,使每个网格最多包含一个交点,且每个网格的相邻网格不包含交点;目标网格交点统计模块,用于查找先验交点所在的目标网格,统计所述目标网格以及所述目标网格的相邻网格在目标方向上包含的网格中的目标交点数量,所述先验交点为预设待识别区域的区域顶点,所述目标方向包括所述