预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113963365A(43)申请公布日2022.01.21(21)申请号202111151226.8(22)申请日2021.09.29(71)申请人深圳中兴网信科技有限公司地址518109广东省深圳市龙华区民治街道北站社区汇隆商务中心2号楼2801(72)发明人庞博(74)专利代理机构北京友联知识产权代理事务所(普通合伙)11343代理人汪海屏王淑梅(51)Int.Cl.G06V30/413(2022.01)G06V30/148(2022.01)G06V10/40(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书12页附图5页(54)发明名称表格识别方法、装置、电子设备和可读存储介质(57)摘要本发明提出了一种表格识别方法、装置、电子设备和可读存储介质。其中,表格识别方法包括:获取第一表格图像;识别第一表格图像中的背景特征和表格特征;根据背景特征和表格特征对第一表格图像进行矫正,以得到第二表格图像;提取第二表格图像中待识别表格的单元格信息和文本信息;根据单元格信息和文本信息生成目标表格。本发明在对图像中的表格进行识别之前,先对图像进行初步处理,去除图像中可能影响表格识别准确性的图像特征,并且对图像中的表格的位置进行调节,从而在开始识别图像中的表格之前先对图像进行更新处理,由于更新后的图像中不存在各种干扰信息,因此对更新的图像进行表格识别,能够提高表格识别的准确性。CN113963365ACN113963365A权利要求书1/2页1.一种表格识别方法,其特征在于,包括:获取第一表格图像;识别所述第一表格图像中的背景特征和表格特征;根据所述背景特征和所述表格特征对所述第一表格图像进行矫正,以得到第二表格图像;提取所述第二表格图像中待识别表格的单元格信息和文本信息;根据所述单元格信息和所述文本信息生成目标表格。2.根据权利要求1所述的表格识别方法,其特征在于,所述根据所述背景特征和所述表格特征对所述第一表格图像进行矫正,以得到第二表格图像,包括:根据所述表格特征,确定所述第一表格图像中的待处理表格的第一位置信息;根据所述第一位置信息,调整所述第一表格图像中所述待处理表格的位置,以得到第三表格图像;识别所述背景特征中的待处理特征;去除所述第三表格图像中的所述待处理特征,以得到所述第二表格图像。3.根据权利要求2所述的表格识别方法,其特征在于,所述去除所述第三表格图像中的所述待处理特征,包括:获取所述待处理特征的第二位置信息;根据所述第二位置信息,提取所述第三表格图像中的第一待处理图像,所述第一待处理图像中包括所述待处理特征;去除所述待处理图像中的第一待处理特征,以得到第二待处理图像;根据所述第二待处理图像对所述第三表格图像进行更新,以得到所述第二表格图像。4.根据权利要求1至3中任一项所述的表格识别方法,其特征在于,所述提取所述第二表格图像中待识别表格的单元格信息,包括:检测所述第二表格图像中待识别表格中直线的第一坐标信息;根据所述第一坐标信息,确定所述待识别表格中单元格的第二坐标信息;根据所述第二坐标信息确定所述单元格信息。5.根据权利要求1至3中任一项所述的表格识别方法,其特征在于,所述提取所述第二表格图像中待识别表格的文本信息,包括:识别所述第二表格图像中的文本特征,并确定所述文本特征在所述第二表格图像中的第三位置信息;根据所述第三位置信息确定所述第二表格图像中的文本识别范围;对位于所述文本识别范围内的所述第二表格图像进行文本识别,以得到所述文本信息。6.根据权利要求5所述的表格识别方法,其特征在于,所述对位于所述文本识别范围内的所述第二表格图像进行文本识别,以得到所述文本信息之后,包括:识别所述文本信息中的语义特征,根据所述语义特征对所述文本信息进行更新。7.根据权利要求1至3中任一项所述的表格识别方法,其特征在于,所述根据所述单元格信息和所述文本信息生成目标表格,包括:根据所述单元格信息确定目标表格模板;2CN113963365A权利要求书2/2页根据所述目标表格模板,对所述文本信息进行格式化,以得到所述目标表格。8.一种表格识别装置,其特征在于,包括:获取单元,用于获取第一表格图像;识别单元,用于识别所述第一表格图像中的背景特征和表格特征;矫正单元,用于根据所述背景特征和所述表格特征对所述第一表格图像进行矫正,以得到第二表格图像;提取单元,用于提取所述第二表格图像中待识别表格的单元格信息和文本信息;生成单元,用于根据所述单元格信息和所述文本信息生成目标表格。9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时