预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111931769A(43)申请公布日2020.11.13(21)申请号202010860553.XG06K9/34(2006.01)(22)申请日2020.08.24G06K9/46(2006.01)G06K9/62(2006.01)(66)本国优先权数据G06N3/08(2006.01)202010612687.X2020.06.30CNG06T5/00(2006.01)(71)申请人北京来也网络科技有限公司地址100080北京市海淀区丹棱路3号中国电子大厦19层1902申请人北京奔影网络科技有限公司(72)发明人胡一川汪冠春褚瑞李玮刘金艳胡景超(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人张大威(51)Int.Cl.G06K9/32(2006.01)权利要求书4页说明书11页附图2页(54)发明名称结合RPA及AI的发票处理、装置、计算设备及存储介质(57)摘要本申请实施例公开一种结合RPA及AI的发票处理方法及装置、计算设备、存储介质。其中,该方法包括:对待处理的发票纸质文件进行扫描,获得对应的发票图像;获取发票图像之中印章所在的区域位置;根据印章所在的区域位置,将印章从发票图像中抠出,得到印章图像;对印章图像之中的印章进行去除以得到去印章图像,并根据印章所在的区域位置,将去印章图像还原至发票图像之中印章图像抠出的位置,得到去印章发票图像;对去印章发票图像进行识别,以得到针对发票纸质文件的电子文件。本申请可以将纸质发票转换成电子文件,在识别转换过程中,可以保证去除发票中印章的同时还能保证被印章覆盖住的字体能够保留下来,避免发票中重要信息丢失。CN111931769ACN111931769A权利要求书1/4页1.一种结合RPA及AI的发票处理方法,其特征在于,包括:S1,对待处理的发票纸质文件进行扫描,获得对应的发票图像;S2,获取所述发票图像之中印章所在的区域位置;S3,根据所述印章所在的区域位置,将所述印章从所述发票图像中抠出,得到印章图像;S4,对所述印章图像之中的印章进行去除以得到去印章图像,并根据所述印章所在的区域位置,将所述去印章图像还原至所述发票图像之中所述印章图像抠出的位置,得到去印章发票图像;S5,对所述去印章发票图像进行识别,以得到针对所述发票纸质文件的电子文件。2.根据权利要求1所述的发票处理方法,其特征在于,所述对所述印章图像之中的印章进行去除以得到去印章图像,包括:S41,当识别所述印章图像为黑白图像时,基于预设的印章去除模型对所述印章图像之中的印章进行去除,得到所述去印章图像;其中,所述印章去除模型通过预设的印章图像样本集中的印章图像和去印章图像训练得到,以建立各印章图像与去印章图像之间的关联关系。3.根据权利要求2所述的发票处理方法,其特征在于,在识别所述印章图像为黑白图像之前,所述方法还包括:S6,分离所述印章图像的颜色通道,并基于颜色通道图识别所述印章图像为彩色图像还是黑白图像。4.根据权利要求2或3所述的发票处理方法,其特征在于,所述印章去除模型通过以下方式得到:S411:获取样本原始图像以及黑白印章样本图像,其中,所述样本原始图像为不带印章的图像,所述黑白印章样本图像为只包含印章信息的黑白图像;S412:将所述样本原始图像和所述黑白印章样本图像结合生成仿真图像,并改变所述仿真图像的亮度、饱和度、灰度,以及将所述仿真图像进行旋转或扭曲,得到全新的印章样本图像;S413:将每张所述印章样本图像输入生成网络中,得到去印章样本图像;其中,所述生成网络用于使得所述印章样本图像与所述去印章样本图像相关联;S414:将所述去印章样本图像输入判别网络中,获取所述判别网络输出的判别结果;其中,所述判别网络将所述去印章样本图像与对应的样本原始图像进行对比判断,判别结果为所述去印章图像为真假原始图像;S415:基于所述判别结果,优化所述生成网络的参数,使得所述生成网络的损失函数与所述判别网络的损失函数的差值减小;S416:判断所述生成网络的损失函数与所述判别网络的损失函数的差值是否小于预设的阈值,若差值小于所述预设的阈值,则将所述生成网络作为所述印章去除模型,否则返回执行所述将每张所述印章样本图像输入生成网络中的步骤。5.根据权利要求1所述的发票处理方法,其特征在于,所述对所述去印章发票图像进行识别,以得到针对所述发票纸质文件的电子文件,包括:S51,将所述去印章发票图像输入至预设的文字识别模型中进行文字识别,得到所述发2CN111931769A权利要求书2/4页票图像之中的文字;其中,所述文字识别模型是通过预设的去印章发票图像样本集中的去印章发票样本图像和发票样本图像中的文字训练得到,以建立去印章