预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111488517A(43)申请公布日2020.08.04(21)申请号201910083845.4(22)申请日2019.01.29(71)申请人北京沃东天骏信息技术有限公司地址100076北京市大兴区经济技术开发区科创十一街18号院2号楼4层A402室(72)发明人李思雯严严(74)专利代理机构北京英赛嘉华知识产权代理有限责任公司11204代理人王达佐马晓亚(51)Int.Cl.G06F16/9535(2019.01)G06K9/62(2006.01)权利要求书3页说明书12页附图4页(54)发明名称用于训练点击率预估模型的方法和装置(57)摘要本申请实施例公开了用于训练点击率预估模型的方法和装置。该方法的一具体实施方式包括获取训练样本,其中,训练样本包括训练样本信息和训练样本标签,训练样本标签用于标识训练样本信息的点击情况;获取训练样本的样本权重;利用训练样本和样本权重对初始点击率预估模型进行训练,得到点击率预估模型。该实施方式提高了点击率预估模型的预估准确度。CN111488517ACN111488517A权利要求书1/3页1.一种用于训练点击率预估模型的方法,包括:获取训练样本,其中,所述训练样本包括训练样本信息和训练样本标签,所述训练样本标签用于标识所述训练样本信息的点击情况;获取所述训练样本的样本权重;利用所述训练样本和所述样本权重对初始点击率预估模型进行训练,得到所述点击率预估模型。2.根据权利要求1所述的方法,其中,所述获取所述训练样本的样本权重,包括:获取所述训练样本信息的历史浏览时间,其中,所述样本信息是历史浏览信息;基于所述历史浏览时间,确定所述样本权重。3.根据权利要求2所述的方法,其中,所述基于所述历史浏览时间,确定所述样本权重,包括:基于所述历史浏览时间,计算样本半衰期;基于牛顿冷却定律和样本半衰期,计算所述样本权重。4.根据权利要求3所述的方法,其中,所述基于所述历史浏览时间,计算样本半衰期,包括:获取候选样本半衰期和预测样本,其中,所述预测样本包括预测样本信息和预测样本标签,所述预测样本标签用于标识所述预测样本信息的点击情况;基于牛顿冷却定律和所述候选样本半衰期,计算候选样本权重;利用所述训练样本和所述候选样本权重对所述初始点击率预估模型进行训练,得到候选点击率预估模型;将所述预测样本信息输入至所述候选点击率预估模型,得到所述预测样本信息的预估点击率;基于所述预估点击率和所述预测样本标签,计算所述候选半衰期对应的正样本排在负样本前面的概率;基于所述正样本排在负样本前面的概率,从所述候选样本半衰期中确定所述样本半衰期。5.根据权利要求1所述的方法,其中,所述利用所述训练样本和所述样本权重对初始点击率预估模型进行训练,得到所述点击率预估模型,包括:基于所述训练样本和所述样本权重对所述初始点击率预估模型的交叉熵损失函数进行改进,得到代价函数;将所述代价函数引入所述初始点击率预估模型,得到改进初始点击率预估模型;将所述训练样本信息和所述样本权重作为输入,将所述训练样本标签作为输出,对所述改进初始点击率预估模型进行训练,得到所述点击率预估模型。6.根据权利要求1-5之一所述的方法,其中,所述方法还包括:获取候选推送信息;将所述候选推送信息输入至所述点击率预估模型,得到所述候选推送信息的预估点击率;基于所述预估点击率,从所述候选推送信息中确定推送信息,以及推送所述推送信息。7.一种用于训练点击率预估模型的装置,包括:2CN111488517A权利要求书2/3页样本获取单元,被配置成获取训练样本,其中,所述训练样本包括训练样本信息和训练样本标签,所述训练样本标签用于标识所述训练样本信息的点击情况;权重获取单元,被配置成获取所述训练样本的样本权重;模型训练单元,被配置成利用所述训练样本和所述样本权重对初始点击率预估模型进行训练,得到所述点击率预估模型。8.根据权利要求7所述的装置,其中,所述样本获取单元包括:时间获取子单元,被配置成获取所述训练样本信息的历史浏览时间,其中,所述样本信息是历史浏览信息;权重确定子单元,被配置成基于所述历史浏览时间,确定所述样本权重。9.根据权利要求8所述的装置,其中,所述权重确定子单元包括:半衰期计算模块,被配置成基于所述历史浏览时间,计算样本半衰期;权重计算模块,被配置成基于牛顿冷却定律和样本半衰期,计算所述样本权重。10.根据权利要求9所述的装置,其中,所述半衰期计算模块包括:样本获取子模块,被配置成获取候选样本半衰期和预测样本,其中,所述预测样本包括预测样本信息和预测样本标签,所述预测样本标签用于标识所述预测样本信息的点击情况;权重计算子模块,被配置成基于牛顿冷却定律和所述候选样本半衰期,计算候