预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115018532A(43)申请公布日2022.09.06(21)申请号202210583338.9(22)申请日2022.05.25(71)申请人北京三快在线科技有限公司地址100080北京市海淀区北四环西路9号2106-030(72)发明人毛雪史鑫磊罗恒亮(74)专利代理机构北京三高永信知识产权代理有限责任公司11138专利代理师谢冬寒(51)Int.Cl.G06Q30/02(2012.01)G06N20/20(2019.01)权利要求书3页说明书18页附图7页(54)发明名称资源发放模型的训练方法、装置、设备、存储介质及产品(57)摘要本申请提供了一种资源发放模型的训练方法、装置、设备、存储介质及产品,属于互联网技术领域。方法包括:获取发放环节序列包括的多个发放环节的样本数据,发放环节的样本数据包括样本账号的参考特征信息、需求信息和第一回报信息;基于发放环节序列包括的多个发放环节的顺序,依次执行如下步骤,直到资源发放模型满足收敛条件为止,得到目标资源发放模型:基于当前发放环节的样本数据,确定当前发放环节的第二回报信息,第二回报信息用于表示样本账号在第一个环节至当前发放环节基于互联网平台发放的虚拟资源,对互联网平台产生的总回报,基于当前发放环节的样本数据和第二回报信息,对资源发放模型进行训练,提高了发放虚拟资源的有效性。CN115018532ACN115018532A权利要求书1/3页1.一种资源发放模型的训练方法,其特征在于,所述方法包括:获取发放环节序列包括的多个发放环节的样本数据,所述发放环节的样本数据包括样本账号的参考特征信息、需求信息和第一回报信息,所述需求信息用于表示所述样本账号在所述参考特征信息表示的参考环境下对互联网平台发放虚拟资源的需求,所述第一回报信息用于表示所述样本账号基于所述虚拟资源,对所述互联网平台产生的回报;基于所述发放环节序列包括的多个发放环节的顺序,依次执行如下步骤,直到资源发放模型满足收敛条件为止,得到目标资源发放模型:基于当前发放环节的样本数据,确定所述当前发放环节的第二回报信息,所述第二回报信息用于表示所述样本账号在第一个环节至所述当前发放环节基于所述互联网平台发放的虚拟资源,对所述互联网平台产生的总回报,基于所述当前发放环节的样本数据和第二回报信息,对所述资源发放模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述基于所述当前发放环节的样本数据和第二回报信息,对所述资源发放模型进行训练,包括:基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息;基于所述参数调整信息,调整所述资源发放模型的模型参数。3.根据权利要求2所述的方法,其特征在于,所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息,包括:基于第一发放环节的第二回报信息和所述当前发放环节的第二回报信息和第一回报信息,确定损失值,所述第一发放环节为所述当前发放环节的上一发放环节;基于所述损失值、所述当前发放环节的参考特征信息和需求信息,确定所述资源发放模型的参数调整信息。4.根据权利要求2或3所述的方法,其特征在于,所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息之前,所述方法还包括:在第一发放环节的第二回报信息表示的第一回报值小于所述当前发放环节的第二回报信息表示的第二回报值的情况下,确定调整所述资源发放模型的模型参数,执行所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息的步骤;其中,所述第一发放环节为所述当前发放环节的上一发放环节。5.根据权利要求1或2所述的方法,其特征在于,所述基于当前发放环节的样本数据,确定所述当前发放环节的第二回报信息,包括:调用第一发放环节训练得到的资源发放模型,所述第一发放环节为所述当前发放环节的上一发放环节;基于所述当前发放环节的样本数据,通过所述资源发放模型,确定所述当前发放环节的第二回报信息。6.根据权利要求1所述的方法,其特征在于,所述第一回报信息的确定过程包括:获取目标商品的点击参数、购买参数、价格参数和所发放虚拟资源的成本参数中的至少一项,所述目标商品为所述虚拟资源能够兑换的商品;基于所述点击参数、所述购买参数、所述价格参数和所述成本参数中的至少一项,确定2CN115018532A权利要求书2/3页所述第一回报信息,所述点击参数、所述购买参数和所述价格参数均与所述第一回报信息正相关,所述成本参数与所述第一回报信息负相关。7.根据权利要求6所述的方法,其特征在于,所述虚拟资源的发放渠道为多个,多个发放渠道分别配置有发放权重;所述基于所述点击参数、所述购买参数、所述价格参