预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113127365A(43)申请公布日2021.07.16(21)申请号202110468771.3(22)申请日2021.04.28(71)申请人百度在线网络技术(北京)有限公司地址100080北京市海淀区上地十街10号(72)发明人刘伟陈由之张博林赛群(74)专利代理机构北京市金杜律师事务所11256代理人赵林琳张昊(51)Int.Cl.G06F11/36(2006.01)G06F16/951(2019.01)G06F16/958(2019.01)G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书8页附图4页(54)发明名称确定网页质量的方法、装置、电子设备和计算机可读存储介质(57)摘要本公开提供了确定网页质量的方法、装置、电子设备和计算机可读存储介质,涉及互联网领域和人工智能领域,尤其涉及机器学习领域和智能推荐领域。具体实现方案为:基于从目标服务器获取的目标网页的页面文本信息,获取与页面文本信息中的展示元素相关联的用于渲染的配置信息;确定配置信息的特征数据;以及基于特征数据,确定与配置信息的质量相关联的质量信息。以此方式,本公开的技术方案可以在静态页面被渲染之前对目标网页的相关信息进行检测,从而实现页面数据质量的实时检测。CN113127365ACN113127365A权利要求书1/2页1.一种用于确定网页质量的方法,包括:基于从目标服务器获取的目标网页的页面文本信息,获取与所述页面文本信息中的展示元素相关联的用于渲染的配置信息;确定所述配置信息的特征数据;以及基于所述特征数据,确定与所述配置信息的质量相关联的质量信息。2.根据权利要求1所述的方法,其中所述渲染包括:基于所述配置信息确定所述展示元素的布置方式。3.根据权利要求1所述的方法,其中获取所述配置信息包括:基于用户输入的要访问的所述目标网页,从所述目标服务器处获取所述页面文本信息;以及通过所述页面文本信息中的所述展示元素获取用于渲染的脚本文件,作为所述配置信息。4.根据权利要求1所述的方法,其中确定所述配置信息的所述特征数据包括:从所述配置信息中获取文本;对获取的所述文本进行向量化;以及基于向量化的所述文本确定所述特征数据。5.根据权利要求1所述的方法,其中确定所述质量信息包括:基于所述特征数据,确定所述配置信息的质量得分。6.根据权利要求5所述的方法,还包括:响应于所述质量得分高于或等于阈值质量得分,基于所述配置信息渲染所述展示元素;或者响应于所述质量得分低于所述阈值质量得分,通过取消所述展示元素的展示,重新布局所述目标网页。7.根据权利要求1所述的方法,其中确定所述质量信息包括:将所述特征数据应用于质量预测模型以确定所述质量信息,所述质量预测模型是将被设置的参考特征数据作为输入以及对应的经标注的参考质量信息作为输出来训练得到的。8.一种用于确定网页质量的装置,包括:配置信息获取模块,被配置为基于从目标服务器获取的目标网页的页面文本信息获取与所述页面文本信息中的展示元素相关联的用于渲染的配置信息;特征数据确定模块,被配置为确定所述配置信息的特征数据;以及质量信息确定模块,被配置为基于所述特征数据确定与所述配置信息的质量相关联的质量信息。9.根据权利要求8所述的装置,其中所述渲染包括:基于所述配置信息确定所述展示元素的布置方式。10.根据权利要求8所述的装置,其中所述配置信息获取模块包括:页面文本信息获取模块,被配置为基于用户输入的要访问的所述目标网页从所述目标服务器处获取所述页面文本信息;以及脚本文件获取模块,被配置为通过所述页面文本信息中的所述展示元素获取用于渲染的脚本文件,作为所述配置信息。2CN113127365A权利要求书2/2页11.根据权利要求8所述的装置,其中所述特征数据确定模块进一步被配置为:从所述配置信息中获取文本;对获取的所述文本进行向量化;以及基于向量化的所述文本确定所述特征数据。12.根据权利要求8所述的装置,其中所述质量信息确定模块包括:质量得分确定模块,被配置为基于所述特征数据确定所述配置信息的质量得分。13.根据权利要求12所述的装置,还包括:渲染模块,被配置为响应于所述质量得分高于或等于阈值质量得分,基于所述配置信息渲染所述展示元素;或者重新布局模块,被配置为响应于所述质量得分低于所述阈值质量得分,通过取消所述展示元素的展示,重新布局所述目标网页。14.根据权利要求8所述的装置,其中所述质量信息确定模块进一步被配置为:将所述特征数据应用于质量预测模型以确定所述质量信息,所述质量预测模型是将被设置的参考特征数据作为输入以及对应的经标注的参考质量信息作为输出来训练得到的。15.一种电