预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114386059A(43)申请公布日2022.04.22(21)申请号202111536063.5(22)申请日2021.12.15(71)申请人北京五八信息技术有限公司地址100083北京市海淀区学清路甲18号中关村东升科技园学院园三层301室(72)发明人王斌史忠伟(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人吕俊秀(51)Int.Cl.G06F21/60(2013.01)G06F16/951(2019.01)权利要求书2页说明书9页附图4页(54)发明名称网页文本混淆反爬虫方法、装置、电子设备及存储介质(57)摘要本发明提供了一种网页文本混淆反爬虫方法、装置、电子设备及存储介质,涉及网站页面安全技术领域。所述方法包括:根据网页文本对应的文本数据生成对应的图片数据,并将图片数据存储至第一服务器;对第一服务器返回的图片数据对应的图片地址进行加密得到加密图片地址,并将加密图片地址存储至第二服务器的预设数据库中;在接收用户终端发送的网页文本对应的文本渲染请求时,向用户终端返回加密图片地址。因此,能够解决相关技术中网页中的可见网页文本无法避免爬虫获取网页数据的问题。CN114386059ACN114386059A权利要求书1/2页1.一种网页文本混淆反爬虫方法,其特征在于,应用于第二服务器,所述方法包括:根据网页文本对应的文本数据生成对应的图片数据,并将所述图片数据存储至第一服务器;对所述第一服务器返回的所述图片数据对应的图片地址进行加密得到加密图片地址,并将所述加密图片地址存储至所述第二服务器的预设数据库中;在接收用户终端发送的所述网页文本对应的文本渲染请求时,向所述用户终端返回所述加密图片地址。2.根据权利要求1所述的方法,其特征在于,根据网页文本对应的文本数据生成对应的图片数据,包括:根据所述文本数据生成对应的标识码;若所述第二服务器中不存在所述标识码,根据所述文本数据生成所述图片数据。3.根据权利要求2所述的方法,其特征在于,若所述第二服务器中不存在所述标识码,根据所述文本数据生成所述图片数据,包括:根据所述文本数据生成对应的图片字节流;在所述图片字节流中加入噪声,以得到所述图片数据。4.根据权利要求1所述的方法,其特征在于,在所述在接收用户终端发送的所述网页文本对应的文本渲染请求时,向所述用户终端返回所述加密图片地址之后,还包括:在所述用户终端中,基于所述加密图片地址发送图片数据请求,所述图片数据请求用于请求所述图片数据;拦截所述图片数据请求,对所述加密图片地址进行重新定位得到所述图片地址;基于所述图片地址请求所述图片数据。5.根据权利要求4所述的方法,其特征在于,拦截所述图片数据请求,对所述加密图片地址进行重新定位得到所述图片地址,包括:通过所述用户终端中的预设脚本,对所述加密图片地址进行解密得到所述图片地址。6.一种网页文本混淆反爬虫装置,其特征在于,应用于第二服务器所述装置包括:处理模块,用于根据网页文本对应的文本数据生成对应的图片数据,并将所述图片数据存储至第一服务器;加密模块,用于对对所述第一服务器返回的所述图片数据对应的图片地址进行加密得到加密图片地址,并将所述加密图片地址存储至所述第二服务器的预设数据库中;发送模块,用于在接收用户终端发送的所述网页文本对应的文本渲染请求时,向所述用户终端返回所述加密图片地址。7.根据权利要求6所述的装置,其特征在于,所述处理模块包括:第一处理子模块,用于根据所述文本数据生成对应的标识码;第二处理子模块,用于若所述第二服务器中不存在所述标识码,根据所述文本数据生成所述图片数据。8.根据权利要求7所述的装置,其特征在于,所述第二处理子模块,包括:转换单元,用于根据所述文本数据生成对应的图片字节流;处理单元,用于在所述图片字节流中加入噪声,以得到所述图片数据。9.根据权利要求6所述的装置,其特征在于,还包括:2CN114386059A权利要求书2/2页第一请求模块,用于在所述在接收用户终端发送的所述网页文本对应的文本渲染请求时,向所述用户终端返回所述加密图片地址之后,在所述用户终端中,基于所述加密图片地址发送图片数据请求,所述图片数据请求用于请求所述图片数据;拦截模块,用于拦截所述图片数据请求,对所述加密图片地址进行重新定位得到所述图片地址请求模块,用于基于所述图片地址请求所述图片数据。10.根据权利要求9所述的装置,其特征在于,所述拦截模块包括:解密单元,用于通过所述用户终端中的预设脚本,对所述加密图片地址进行解密得到所述图片地址。11.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利