预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114463091A(43)申请公布日2022.05.10(21)申请号202210113124.5H04L67/55(2022.01)(22)申请日2022.01.29(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人王颖帅苗诗雨(74)专利代理机构北京品源专利代理有限公司11332专利代理师朱彩银(51)Int.Cl.G06Q30/06(2012.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书15页附图6页(54)发明名称信息推送模型训练和信息推送方法、装置、设备和介质(57)摘要本发明实施例公开了一种信息推送模型训练和信息推送方法、装置、设备和介质,其中,方法包括:将用户购物行为样本数据输入至多任务学习网络,并将跨品类物品购物行为样本数据输入至跨品类专家网络和跨品类专家网络的门控网络;基于跨品类专家网络的输出结果及其门控网络的输出结果生成多任务学习网络中的各任务塔网络的输入信息,并将输入信息输入到各任务塔网络中;将各任务塔网络的输出结果与多任务学习网络中的自适应专家网络的输出结果进行融合,并根据融合结果对多任务学习网络、跨品类专家网络及其门控网络的参数进行更新,以训练得到目标信息推送模型。该方案实现了为用户推送更多不同品类的物品信息,提升用户所浏览的物品信息的丰富度。CN114463091ACN114463091A权利要求书1/3页1.一种信息推送模型训练方法,其特征在于,所述方法包括:获取用户购物行为样本数据,将所述用户购物行为样本数据输入至多任务学习网络,并将所述用户购物行为样本数据中的跨品类物品购物行为样本数据输入至跨品类专家网络和所述跨品类专家网络的门控网络,其中,所述跨品类专家网络用于提取跨品类物品的特征信息,所述跨品类专家网络的门控网络用于确定所述跨品类专家网络输出结果的权重参数;基于所述跨品类专家网络的输出结果和所述跨品类专家网络的门控网络的输出结果生成所述多任务学习网络中的各任务塔网络的输入信息,并将所述输入信息输入到所述各任务塔网络中;将所述各任务塔网络的输出结果与所述多任务学习网络中的自适应专家网络的输出结果进行融合,并根据融合结果确定第一损失函数数值,基于所述第一损失函数数值对所述多任务学习网络、所述跨品类专家网络和所述跨品类专家网络的门控网络的参数进行更新,以训练得到目标信息推送模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述跨品类专家网络的输出结果和所述跨品类专家网络的门控网络的输出结果生成所述多任务学习网络中的各任务塔网络的输入信息,包括:基于所述跨品类专家网络的输出结果和所述跨品类专家网络的门控网络的输出结果确定所述各任务塔网络的第一输入信息;将所述多任务学习网络中各任务的门控网络的输出结果,与各任务对应的专家网络的输出结果按照预设运算规则计算,得到所述各任务塔网络的第二输入信息;将所述第一输入信息和所述第二输入信息相叠加,得到所述多任务学习网络中的各任务塔网络的输入信息。3.根据权利要求2所述的方法,其特征在于,将输出结果只作为一个任务塔网络的部分输入信息的专家网络称为私有专家网络,将输出结果同时作为多个任务塔网络的部分输入信息的专家网络称为公共专家网络,所述基于所述第一损失函数数值对所述多任务学习网络、所述跨品类专家网络和所述门控网络的参数进行更新,包括:根据所述第一损失函数对所述门控网络和所述多任务学习网络中的自适应专家网络和各任务的门控网络的参数进行更新;针对所述多任务学习网络和所述跨品类专家网络中的私有专家网络,根据接收所述私有专家信息输入的任务塔网络的损失函数数值进行参数更新;针对所述多任务学习网络和所述跨品类专家网络中的公共专家网络,在相邻两次对所述公共专家网络的参数进行更新过程中,根据不同任务塔网络的损失函数数值进行参数更新。4.根据权利要求2所述的方法,其特征在于,所述多任务学习网络中的各任务的门控网络设置有一层路由筛选网络,用于对各任务对应的专家网络的输出结果进行筛选,所述计算所述多任务学习网络中各任务的门控网络的输出结果与各任务对应的专家网络的输出结果按照预设运算规则计算得到所述各任务塔网络的第二输入信息,包括:将所述各任务门的控网络的输出结果与所述路由筛选网络设定的门控筛选数值进行比较,并将所述各任务门的控网络的输出结果中小于所述门控筛选数值的数值置0,以更新2CN114463091A权利要求书2/3页所述各任务门的控网络的输出结果;将更新后的各所述任务门控网络的输出结果分别与各任务对应的专家网络的输出结果按照预设运算规则计算得