基于RPA及AI的文件处理方法及装置-豆柴文库

基于RPA及AI的文件处理方法及装置.pdf

2023-07-25

10金币

1KB

18页

秋花****姐姐

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113723270A(43)申请公布日2021.11.30(21)申请号202110986254.5(22)申请日2021.08.25(71)申请人北京来也网络科技有限公司地址100080北京市海淀区丹棱路3号中国电子大厦19层1902申请人来也科技（北京）有限公司(72)发明人杨明汪冠春胡一川褚瑞李玮(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人罗岚(51)Int.Cl.G06K9/00(2006.01)G06K9/34(2006.01)G06Q10/10(2012.01)权利要求书3页说明书9页附图5页(54)发明名称基于RPA及AI的文件处理方法及装置(57)摘要本申请公开了一种基于RPA及AI的文件处理方法以及装置。其中该方法包括：响应于基于机器人流程自动化RPA技术发现待处理的便携式文档格式PDF扫描件，对所述PDF扫描件进行图像处理以得到目标图像；获取针对所述目标图像的光学字符识别OCR识别信息；基于人工智能AI技术对所述OCR识别信息进行抽取和文档分类，获得针对所述OCR识别信息的抽取结果和所属文档类别；根据所述所属文档类别，将所述抽取结果录入至业务系统。相较于传统人工处理方法，本申请所提供的文件处理方法具有效率高、错误率低、人工成本低等优点。CN113723270ACN113723270A权利要求书1/3页1.一种基于RPA及AI的文件处理方法，其特征在于，包括：响应于基于机器人流程自动化RPA技术发现待处理的便携式文档格式PDF扫描件，对所述PDF扫描件进行图像处理以得到目标图像；其中，所述PDF扫描件是由图像采集装置对纸质文件进行扫描而生成的；获取针对所述目标图像的光学字符识别OCR识别信息；基于人工智能AI技术对所述OCR识别信息进行抽取和文档分类，获得针对所述OCR识别信息的抽取结果和所属文档类别；根据所述所属文档类别，将所述抽取结果录入至业务系统。2.根据权利要求1所述的方法，其特征在于，所述获取针对所述目标图像的光学字符识别OCR识别信息，包括：基于OCR识别引擎对所述目标图像进行识别，获得针对所述目标图像的OCR识别信息。3.根据权利要求1所述的方法，其特征在于，所述获取针对所述目标图像的光学字符识别OCR识别信息，包括：将所述目标图像发送给服务器；获取所述服务器基于OCR识别引擎对所述目标图像进行识别而得到的OCR识别信息。4.根据权利要求2或3所述的方法，其特征在于，所述基于OCR识别引擎对所述目标图像进行识别，包括：响应于识别出所述目标图像内容中包含表格，确定所述表格的所属类型；从预设的多个表格信息抽取器中确定出与所述所属类型匹配的目标表格信息抽取器；基于所述目标表格信息抽取器对所述目标图像之中表格进行识别。5.根据权利要求1所述的方法，其特征在于，所述基于人工智能AI技术对所述OCR识别信息进行抽取和文档分类，获得针对所述OCR识别信息的抽取结果和所属文档类别，包括：基于AI技术对所述OCR识别信息进行抽取，获得所述OCR识别信息之中的关键字段以及所述关键字段的属性值；基于AI技术对所述OCR识别信息进行文档分类，获得所述OCR识别信息的所属文档类别。6.根据权利要求1所述的方法，其特征在于，所述根据所述所属文档类别，将所述抽取结果录入至业务系统，包括：根据所述所属文档类别，获取所述业务系统之中与所述所属文档类别匹配的档案信息界面；根据所述档案信息界面之中各表单字段和所述抽取结果之中关键字段，将所述关键字段的属性值填写至所述档案信息界面之中与所述关键字段对应的表单字段的属性值位置。7.根据权利要求1所述的方法，其特征在于，在所述基于人工智能AI技术对所述OCR识别信息进行抽取和文档分类之前，所述方法还包括：对所述OCR识别信息进行数据清洗处理。8.根据权利要求1所述的方法，其特征在于，还包括：对所述OCR识别信息进行纠错处理；将经过所述纠错处理后的OCR识别信息生成对应的双层PDF文件，并存储所述双层PDF文件。2CN113723270A权利要求书2/3页9.一种基于RPA及AI的文件处理装置，其特征在于，包括：第一获取模块，用于响应于基于机器人流程自动化RPA技术发现待处理的便携式文档格式PDF扫描件，对所述PDF扫描件进行图像处理以得到目标图像；其中，所述PDF扫描件是由图像采集装置对纸质文件进行扫描而生成的；第二获取模块，用于获取针对所述目标图像的光学字符识别OCR识别信息；第三获取模块，用于基于人工智能AI技术对所述OCR识别信息进行抽取和文档分类，获得针对所述OCR识别信息的抽取结果和所属文档类别；录入模块，用于根据所述所属文档类别，将所述抽取结果录入至业务系统。10.根据

相关资料

基于RPA及AI的文件处理方法及装置.pdf

本申请公开了一种基于RPA及AI的文件处理方法以及装置。其中该方法包括：响应于基于机器人流程自动化RPA技术发现待处理的便携式文档格式PDF扫描件，对所述PDF扫描件进行图像处理以得到目标图像；获取针对所述目标图像的光学字符识别OCR识别信息；基于人工智能AI技术对所述OCR识别信息进行抽取和文档分类，获得针对所述OCR识别信息的抽取结果和所属文档类别；根据所述所属文档类别，将所述抽取结果录入至业务系统。相较于传统人工处理方法，本申请所提供的文件处理方法具有效率高、错误率低、人工成本低等优点。

2023-07-25

1KB

基于AI和RPA的业务处理方法及装置.pdf

本公开提出一种基于人工智能AI和机器人流程自动化RPA的业务处理方法及装置,涉及RPA及AI技术领域。其中,该方法包括:获取业务处理演示请求,其中,演示请求中包含目标业务的标识;从预设的操作文档库中获取目标业务的标识对应的目标操作文档,其中,目标操作文档为RPA基于录制的与目标业务相关的操作数据生成的文档;调用目标操作文档,以对目标业务流程进行演示。由此,可以基于目标业务的标识,确定出对应的目标操作文档,之后调用该目标操作文档,即可对目标业务的处理流程进行演示,从而可以使得用户可以清晰、直观的了解到目标业

2023-05-23

945KB

基于AI和RPA的文件标注方法、装置、设备和介质.pdf

本公开提出一种基于AI和RPA的文件标注方法、装置、设备和介质，涉及AI和RPA领域，其中，方法包括：RPA系统获取文件标注请求；RPA系统响应于文件标注请求，生成与文件标注请求对应的响应结果；RPA系统根据所述响应结果，绘制待标注文件对应的目标图片；RPA系统响应于鼠标事件，确定目标图片中的文本标注的区域范围；RPA系统根据对待标注文件进行光学字符识别OCR所获取的第一文本信息和第一文本信息的各个文本片段对应的位置信息，确定区域范围内的文本标注结果。由此，可实现图片中文本信息的提取以及文本中不连续文字的

2023-07-25

1.1MB

结合RPA和AI的流程处理方法及装置.pdf

本申请公开了一种结合RPA和AI的流程处理方法及装置。其中,该流程处理方法包括:显示流程组界面;获取用户针对所述流程组界面上的流程组的运行指令,所述流程组中包括多个流程;根据所述运行指令运行所述流程组中的多个流程。由此,可通过将流程拆成多段进行自由编组,实现了流程的灵活取用,减少了大流程文件的传输时间,提高了流程复用率,从而能够更加灵活方便地应对更多复杂场景,显著提升了工作效率。

2023-05-23

990KB

基于RPA和AI的庭前通知文书处理方法、装置、设备及介质.pdf

本申请提出一种基于机器人流程自动化RPA和人工智能AI的庭前通知文书处理方法、装置、设备及介质。其中,该方法包括:S1、对于当前需要制作庭前通知文书的目标案件,获取目标案件的关键信息,该关键信息包括案件的当事人信息和案件信息;S2、基于关键信息生成庭前通知文书,该庭前通知文书用于通知案件当事人法院开庭审理的开庭信息,该开庭信息中包括案件信息;S3、将生成的庭前通知文书发送给当事人。通过采用上述技术方案,解决了相关技术中人工手动制作文书和发送文书效率和准确率低下的问题。

2023-05-23

1MB