网页文本混淆反爬虫方法、装置、电子设备及存储介质.pdf
雨巷****莺莺
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
网页文本混淆反爬虫方法、装置、电子设备及存储介质.pdf
本发明提供了一种网页文本混淆反爬虫方法、装置、电子设备及存储介质,涉及网站页面安全技术领域。所述方法包括:根据网页文本对应的文本数据生成对应的图片数据,并将图片数据存储至第一服务器;对第一服务器返回的图片数据对应的图片地址进行加密得到加密图片地址,并将加密图片地址存储至第二服务器的预设数据库中;在接收用户终端发送的网页文本对应的文本渲染请求时,向用户终端返回加密图片地址。因此,能够解决相关技术中网页中的可见网页文本无法避免爬虫获取网页数据的问题。
代码的反混淆方法、装置、电子设备及存储介质.pdf
本申请提供一种代码的反混淆方法、装置、电子设备及存储介质,方法包括:获取待处理代码的Token列表;所述Token列表中的各Token为构成所述待处理代码的各代码单词;对所述Token列表中的各Token进行反混淆处理,得到第一反混淆代码;对所述第一反混淆代码进行解析,得到所述第一反混淆代码的AST;对所述AST的目标节点中的内容进行模拟执行得到第一执行结果,并根据所述第一执行结果替换所述目标节点的内容;所述目标节点为所述AST中属于设定类型的节点;根据替换后的AST得到最终的反混淆代码。上述方案降低了混
反爬虫处理方法、装置、电子设备及可读存储介质.pdf
本发明实施例提供了一种反爬虫处理方法、装置、电子设备及可读存储介质。该方法中,响应于访问请求,从第一历史IP对应的爬虫指数中查找目标IP对应的爬虫指数,作为目标爬虫指数;第一历史IP和第一历史IP对应的爬虫指数根据至少两个第二网站节点的IP访问记录获得,爬虫指数用于表征第一历史IP属于爬虫IP的概率,目标IP为访问请求使用的IP。在目标爬虫指数大于预设指数阈值的情况下,执行预设反爬虫操作。这样,利用多个第二网站节点的访问记录识别爬虫IP,可以实现快速识别爬虫IP,并对其执行反爬虫操作。
混淆代码的反混淆方法、装置、可读介质及电子设备.pdf
本公开涉及一种混淆代码的反混淆方法、装置、可读介质及电子设备,该方法包括:获取混淆代码文本,将混淆代码文本转换为抽象语法树,对抽象语法树进行语法分析,以获取混淆代码文本中代码块对应的混淆方式,确定混淆方式对应的反混淆方案,根据反混淆方案对代码块进行处理得到反混淆后的代码文本,根据反混淆后的代码文本得到目标代码文本。通过反混淆方案,使得开发人员能够非常快速的获取反混淆后的高可读性的目标代码文本,同时快速的获取到网页的加密算法。
网页源代码混淆方法、装置、电子装置和存储介质.pdf
本申请涉及一种网页源代码混淆方法、装置、电子装置和存储介质,其中,该网页源代码混淆方法包括:获取网页源代码;将所述网页源代码中的第一预设类型字符替换为第二预设类型字符,得到替换代码,所述第一预设类型字符至少包括中文字符,所述第二预设类型字符至少包括数字字符;通过预设加密方式对所述替换代码进行加密,得到加密代码;将所述加密代码进行压缩,得到目标编码。通过本申请,解决了现有技术中由于正常代码与冗余代码混合导致的故障排查效率低下的问题,实现了在对网页源代码进行防破解保护的同时,提高运维人员故障排查效率的技术效果