预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106611010A(43)申请公布日2017.05.03(21)申请号201510703871.4(22)申请日2015.10.26(71)申请人北京国双科技有限公司地址100086北京市海淀区双榆树小区知春路76号翠宫饭店8层A间(72)发明人李新国冯鸳鹤詹小磊(74)专利代理机构北京康信知识产权代理有限责任公司11240代理人韩建伟张永明(51)Int.Cl.G06F17/30(2006.01)权利要求书3页说明书12页附图1页(54)发明名称网页加载速度的确定方法和装置(57)摘要本申请公开了一种网页加载速度的确定方法和装置。其中,该方法包括:对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,从获取的访问数据中提取在同一会话中同一来源在同一网页的停留时间,根据停留时间确定访问的网页是否为加载速度慢的网页,在确定出加载速度慢的网页的情况下,检测确定出的加载速度慢的网页中是否存在列表页,在检测出存在列表页时,剔除确定出的加载速度慢的网页中的列表页。本申请解决了对加载速度慢的网页判断不准确的技术问题。CN106611010ACN106611010A权利要求书1/3页1.一种网页加载速度的确定方法,其特征在于,包括:对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据;从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间;根据所述停留时间确定访问的网页是否为加载速度慢的网页;在确定出加载速度慢的网页的情况下,检测所述确定出的加载速度慢的网页中是否存在列表页;在检测出存在所述列表页时,剔除所述确定出的加载速度慢的网页中的列表页。2.根据权利要求1所述的方法,其特征在于,在确定出加载速度慢的网页的情况下,检测所述确定出的加载速度慢的网页是否存在列表页包括:在确定出加载速度慢的网页的情况下,记录所述加载速度慢的网页的统一资源定位符;爬取记录的统一资源定位符对应的网页数据;根据所述网页数据判断所述记录的统一资源定位符对应的网页是否为列表页。3.根据权利要求1所述的方法,其特征在于,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:统计在所述同一会话中所述同一来源在所述同一网页的总停留时间和总访问次数;获取在所述同一会话中所述同一来源最后一次访问所述同一网页的停留时间;利用以下公式计算在所述同一会话中除最后一次访问所述同一网页的平均访问时间:t=(T-T1)/(N-1)其中,T为所述总停留时间,T1为所述最后一次访问所述同一网页的停留时间,N为所述总访问次数;判断所述t是否大于或等于时间阈值;在所述t大于或等于所述时间阈值时,确定所述访问的网页为加载速度慢的网页。4.根据权利要求1所述的方法,其特征在于,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:统计在所述同一会话中所述同一来源访问所述同一网页的停留时间大于等于时间阈值的访问次数;判断停留时间大于等于所述时间阈值的访问次数是否超过次数阈值;在判断出停留时间大于等于所述时间阈值的访问次数超过次数阈值时,确定所述访问的网页为加载速度慢的网页。5.根据权利要求1至4中任一项所述的方法,其特征在于,在对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据之后,以及从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间之前,所述方法还包括:按照访问的时间先后顺序对在同一会话中同一来源对所述同一网页的访问数据进行排序;2CN106611010A权利要求书2/3页依次判断相邻两条访问数据之间的时间间隔是否小于时间间隔阈值;在相邻两条访问数据之间的时间间隔小于所述时间间隔阈值时,剔除相邻两条访问数据中后一条访问数据。6.一种网页加载速度的确定装置,其特征在于,包括:获取单元,用于对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据;提取单元,用于从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间;确定单元,用于根据所述停留时间确定访问的网页是否为加载速度慢的网页;检测单元,用于在确定出加载速度慢的网页的情况下,检测所述确定出的加载速度慢的网页中是否存在列表页;第一剔除单元,用于在检测出存在所述列表页时,剔除所述确定出的加载速度慢的网页中的列表页。7.根据权利要求6所述的装置,其特征在于,所述检测单元包括:记录模块,用于在确定出加载速度慢的网页的情况下,记录所述加载速度慢的网页的统一资源定位符;爬取模块,用于爬取记录的统一资源定位符对应的网页数据;第一判断模块,用于根据所述