预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113761352A(43)申请公布日2021.12.07(21)申请号202110322526.1(22)申请日2021.03.25(71)申请人北京沃东天骏信息技术有限公司地址100176北京市经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人张璨璨郑妍王冬月丁卓冶包勇军(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人张娜臧建明(51)Int.Cl.G06F16/9535(2019.01)G06Q30/06(2012.01)G06N20/00(2019.01)权利要求书3页说明书10页附图2页(54)发明名称信息推送方法、装置、设备和存储介质(57)摘要本申请提供一种信息推送方法、装置、设备和存储介质,其中,该方法包括:获取客户端当前所展示的推荐场景对应的场景模型,根据推荐场景对应的场景模型,预估用户在推荐场景中偏好的产品,在推荐场景中推荐用户偏好的产品的信息。该技术方案中,通过使用多个推荐场景的联合数据和场景任务训练得到的场景模型,预估用户在每个推荐场景中偏好的产品,能够实现不同推荐场景的数据共享,充分考虑不同推荐场景下每个场景任务之间的关联性,更加符合用户反馈数据的实际情况,能够更加准确的预估出用户的产品偏好,提升信息的推荐效果。CN113761352ACN113761352A权利要求书1/3页1.一种信息推送方法,其特征在于,所述方法包括:获取客户端当前所展示的推荐场景对应的场景模型,所述推荐场景用于表征客户端的产品推荐页,所述场景模型通过多个推荐场景的联合数据和场景任务训练得到,所述联合数据包括场景标识、任务标识和用户的历史行为特征,所述场景任务包括点击任务和下单任务;根据所述推荐场景对应的场景模型,预估用户在所述推荐场景中偏好的产品;在所述推荐场景中推荐用户偏好的产品的信息。2.根据权利要求1所述的方法,其特征在于,所述获取客户端当前所展示的推荐场景对应的场景模型之前,所述方法还包括:获取客户端提交的多个推荐场景的场景任务和联合数据;根据预设损失函数、所述场景任务和所述联合数据,对预设模型进行训练,得到每个推荐场景对应的场景模型。3.根据权利要求2所述的方法,其特征在于,所述预设模型包括共享层和与每个场景任务对应的塔层,所述根据预设损失函数、所述场景任务和所述联合数据,对预设模型进行训练,得到每个推荐场景对应的场景模型,包括:根据所述场景标识和任务标识,对推荐场景和场景任务进行识别;根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重;根据所述自适应权重,对每个推荐场景的场景任务进行加权求和,分别输入至每个场景任务对应的塔层;根据所述塔层,对每个推荐场景的场景任务进行解耦,得到每个推荐场景对应的场景模型。4.根据权利要求3所述的方法,其特征在于,所述预设损失函数为:上式中,表示样本i是否属于场景任务t对应的推荐场景St,ωt表示场景任务t的权重,为加权交叉熵。5.根据权利要求4所述的方法,其特征在于,所述根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重之前,所述方法还包括:获取场景任务t的正样本数量和场景任务t的负样本数量;根据预设权重策略、所述正样本数量和负样本数量,对所述预设损失函数进行权重分配。6.根据权利要求5所述的方法,其特征在于,所述预设权重策略为:2CN113761352A权利要求书2/3页上式中,表示场景任务t的正样本数量,表示场景任务t的负样本数量,为计算加权交叉熵时正样本的系数。7.根据权利要求3所述的方法,其特征在于,所述共享层包括专家网络和门控网络,所述根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重,包括:将所述联合数据输入至所述专家网络和门控网络;根据所述预设损失函数,对所述专家网络和门控网络进行训练,得到不同场景任务的自适应权重。8.根据权利要求1所述的方法,其特征在于,所述根据所述推荐场景对应的场景模型,预估用户在所述推荐场景中偏好的产品,包括:根据所述场景模型,获取所述推荐场景的场景任务的输出,所述场景任务的输出用于指示所述场景任务的重要性得分;根据预设融合策略,对所述推荐场景的场景任务进行融合,得到所述推荐场景的输出,所述推荐场景的输出用于指示用户对所述推荐场景中的不同产品的偏好程度;根据所述推荐场景的输出,得到用户在所述推荐场景中偏好的产品。9.根据权利要求8所述的方法,其特征在于,所述预设融合策略为:上式中,表示推荐场景s的输出,Ts表示推荐场景s的所有场景任务,表示场景任务t输出的权重,表示场景任务t的输出。10.根据权利要求1