预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112711692A(43)申请公布日2021.04.27(21)申请号202110041088.1(22)申请日2021.01.13(71)申请人深圳前瞻资讯股份有限公司地址518000广东省深圳市福田区红荔西路新洲路交界处第壹世界广场塔楼19层-A(72)发明人邹文锋(51)Int.Cl.G06F16/951(2019.01)G06F16/958(2019.01)G06F40/109(2020.01)G06F40/126(2020.01)权利要求书1页说明书5页附图3页(54)发明名称网页端数据防抓取方法、系统及智能终端(57)摘要本申请涉及一种网页端数据防抓取方法、系统及智能终端,属于计算机数据安全的领域,网页端数据防抓取方法包括获取客户端网页访问请求;根据网页访问请求,调用字体数据库中的字体,将请求访问的网页数据中需要保护的字符替换为对应字体的字符编码,得到替换后的第一网页数据;将第一网页数据、调用的字体及字体对应的字符和字符编码的对应关系发送至请求的客户端,以使客户端能够根据字符和字符编码的对应关系对替换后的字符编码进行解析,从而使客户端能够成功对第一网页数据进行渲染后得到在客户端浏览器上正常显示的第二网页数据。与相关技术相比,本申请具有改善服务器资源消耗较大的问题的效果。CN112711692ACN112711692A权利要求书1/1页1.一种网页端数据防抓取方法,其特征在于:所述防抓取方法包括,获取客户端网页访问请求;根据所述网页访问请求,调用字体数据库中的字体,将请求访问的网页数据中需要保护的字符替换为对应字体的字符编码,得到替换后的第一网页数据,其中,所述字体数据库中存储有字体及字体对应的字符和字符编码的对应关系;以及,将所述第一网页数据、调用的字体及字体对应的字符和字符编码的对应关系发送至请求的客户端,以使客户端能够根据字符和字符编码的对应关系对替换后的字符编码进行解析,从而使客户端能够成功对第一网页数据进行渲染后得到在客户端浏览器上正常显示的第二网页数据。2.根据权利要求1所述的网页端数据防抓取方法,其特征在于:所述字体数据库包括字体表和字体映射关系表;其中,所述字体表,存储有但不限于每个字体的base64字符串、字体名和字体格式;所述字体映射关系表,存储有但不限于每个字体里的每个字符和字符编码对应关系。3.根据权利要求1所述的网页端数据防抓取方法,其特征在于:所述字体数据库包括两个以上的字体关系表,每个所述字体关系表存储有字体的base64字符串、字体名、字体格式以及字体对应的字符和字符编码的对应关系。4.根据权利要求2或3所述的网页端数据防抓取方法,其特征在于:所述字符包括但不限于汉字、数字、符号和字母等数据。5.根据权利要求1所述的网页端数据防抓取方法,其特征在于:所述调用的字体是随机的。6.根据权利要求1所述的网页端数据防抓取方法,其特征在于:所述调用的字体是指定的。7.一种网页端数据防抓取系统,其特征在于:所述防抓取系统包括,网页访问请求获取模块,用于获取客户端网页访问请求;防抓取替换模块,用于根据所述网页访问请求,调用字体数据库中的字体,将请求访问的网页数据中需要保护的字符替换为对应字体的字符编码,得到替换后的第一网页数据,其中,所述字体数据库中存储有字体及字体中每个字符和字符编码的对应关系;以及,数据发送模块,用于将所述第一网页数据、调用的字体及字体对应的字符和字符编码的对应关系发送至请求的客户端,以使客户端能够根据字符和字符编码的对应关系对替换后的字符编码进行解析,从而使客户端能够成功对第一网页数据进行渲染后得到在客户端浏览器上正常显示的第二网页数据。8.一种智能终端,其特征在于:包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至6中任一种方法的计算机程序。9.一种计算机可读存储介质,其特征在于:存储有能够被处理器加载并执行如权利要求1至6中任一种方法的计算机程序。2CN112711692A说明书1/5页网页端数据防抓取方法、系统及智能终端技术领域[0001]本申请涉及计算机数据安全的领域,尤其是涉及一种网页端数据防抓取方法、系统及智能终端。背景技术[0002]网络爬虫,又称为网页蜘蛛、网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。随着网络的迅速发展,万维网成为大量信息的载体,越来越多的企业建立了自己的网站,用于宣传产品、发布信息、顾客服务等。但随着爬虫技术的发展,企业网页端数据都存在着被抓取的风险,迫切需要防抓取方法来保护数据。[0003]目前,最常用的防抓取技术主要有以下几类:(一)robots协议;(二)通过访问频次、IP、userAgent、token等,判