预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110647878A(43)申请公布日2020.01.03(21)申请号201910718790.XG06F11/30(2006.01)(22)申请日2019.08.05G06N3/04(2006.01)(71)申请人紫光西部数据(南京)有限公司地址210001江苏省南京市秦淮区永智路6号白下高新技术产业园区中国云计算创新基地A栋7楼(72)发明人溥磊(74)专利代理机构北京挺立专利事务所(普通合伙)11265代理人陈列生(51)Int.Cl.G06K9/20(2006.01)G06K9/34(2006.01)G06T5/00(2006.01)G06F16/16(2019.01)权利要求书2页说明书10页附图3页(54)发明名称基于截屏图片的数据处理方法(57)摘要本发明公开了一种基于截屏图片的数据处理方法,所述基于截屏图片的数据处理方法包括命令窗口位置识别与特定窗口边界标定与截取,文字背景统一,字符边界清晰,图像噪声消除,基于深度学习算法的光学文字识别,根据统计贝叶斯模型并基于字符的单个文本文字纠正去噪,基于整段文本文字的纠正去噪,多文本文字合并的功能。用于保留核心数据库操作记录,实时记录屏幕截图,以图片形式保留所有对数据库的操作过程。再对图片进行光学文字分析矫正,从根源上避免了人员对核心数据库的无监督操作或者操作时监督失败,保证了数据库的安全。CN110647878ACN110647878A权利要求书1/2页1.一种基于截屏图片的数据处理方法,其特征在于,包括:在检测到目标应用配置的客户端启动时,获取目标命令窗口图片,并对所述目标命令窗口图片进行预处理,得到清晰化图片;获取所述清晰化图片,并基于LSTM人工神经网络对所述清晰化图片进行光学文字识别处理,生成记录所述清晰化图片中的文本信息的文本文件,并保存至目标目录下;获取所述文本文件,并对所述文本文件内的文本基于字符的单个文本文字进行纠正去噪处理,生成临时文本;获取所述临时文本,并对所述临时文本基于整行段文本文字进行纠正去噪处理,生成临时文本文档;获取所述临时文本文档,并对所述临时文本文档进行基于数据库命令的纠正去噪处理,并生成目标文本;获取所述目标文本,并对所述目标文本进行多文本文字的合并处理,生成合并文本保存至目标目录下。2.如权利要求1所述的基于截屏图片的数据处理方法,其特征在于,获取目标命令窗口图片之前,所述方法还包括:获取截屏图片,逐行扫描所述截屏图片,搜索所述截屏图片内的两条水平边界和两条垂直边界,并截取两条水平边界和两条垂直边界的围合区域标定为所述目标命令窗口图片。3.如权利要求2所述的基于截屏图片的数据处理方法,其特征在于,搜索所述截屏图片内的两条水平边界和两条垂直边界,包括:当未搜索到两条所述水平边界和两条所述垂直边界中的任意一个,则生成空白图片;当未搜索到第一条所述垂直边界或第二条所述水平边界或第二条所述垂直边界中的一个,则重新逐行扫描截屏图片,重新搜索第一条所述水平边界;当搜索到两条所述水平边界和两条所述垂直边界,则截取两条所述水平边界和两条所述垂直边界的围合区域标定为所述目标命令窗口图片。4.如权利要求3所述的基于截屏图片的数据处理方法,其特征在于,当搜索到两条所述水平边界和两条所述垂直边界,则截取两条所述水平边界和两条所述垂直边界的围合区域标定为所述目标命令窗口图片,包括:当搜索到第一条水平边界时,标定所述第一条水平边界为命令窗口的上边界;在以所述第一条水平边界建立的坐标系下,当搜索到垂直于第一条水平边界的第一条垂直边界时,搜索第二条水平边界,所述第二条水平边界平行于所述第一条水平边界,且垂直于所述第一条垂直边界;当搜索到两条水平边界和第一条垂直边界时,在两条水平边界中间搜索第二条垂直边界。5.如权利要求1所述的基于截屏图片的数据处理方法,其特征在于,对所述目标命令窗口图片进行预处理,得到清晰化图片,包括:对所述目标命令窗口图片中被选定的文本信息进行文字背景统一处理,得到第一处理图片,包括:通过颜色识别将所述目标命令窗口图片中被选定的文本信息区域进行标识,通过开闭2CN110647878A权利要求书2/2页运算将标识区域进行填实,通过二值化将填实区域从整体中进行分割,获取分割区域的边界信息,用二值化分割出来的边界信息从所述命令窗口图片中裁剪出需要变换的区域内容,通过二值化将裁剪出需要变换的区域内容变化为黑色背景白色字体,通过颜色反转将变化为黑色背景白色字体的区域变换为白色背景黑色字体,将白色背景黑色字体的区域重新回填覆盖所述目标命令窗口图片中的标识区域;对所述第一处理图片进行图像噪声消除处理,得到第二处理图片,包括:获取所述第一处理图片,对所述第一处理图片进行固定大小的区