预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115081512A(43)申请公布日2022.09.20(21)申请号202210537277.2(22)申请日2022.05.17(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人谢世明陈鸿吴军曾多元野沈僮(74)专利代理机构北京恒博知识产权代理有限公司11528专利代理师范胜祥(51)Int.Cl.G06K9/62(2022.01)G06N20/00(2019.01)权利要求书3页说明书16页附图6页(54)发明名称特征补齐方法及装置、特征补齐模型、介质、设备及产品(57)摘要本说明书实施例提供一种特征补齐方法、特征补齐装置、特征补齐模型、计算机可读存储介质、电子设备以及计算机程序产品,该方法包括本说明书示例性的实施例提供的方案基于训练后的机器学习模型(即,基于特征补齐模型)实现的,且该特征补齐模型的生成器的损失函数为基于样本用户特征的显示分布建模确定的。具体地,将关于同一用户的目标特征输入至上述特征补齐模型,其中,上述目标特征中包含一个或多个待补齐元素。经该特征补齐模型的生成器处理后输出与目标特征对应的目标隐向量,其中,该目标隐向量包含目标连续子特征和目标离散子特征。进一步地,根据目标连续子特征确定和目标离散子特征,确定上述目标特征的补齐特征。CN115081512ACN115081512A权利要求书1/3页1.一种特征补齐方法,其中,所述方法包括:将目标特征输入至特征补齐模型,其中,所述目标特征中包含一个或多个待补齐元素,所述目标特征所包含的多个元素用于反映属于同一用户的多个属性;经所述特征补齐模型的生成器处理后输出与所述目标特征对应的目标隐向量,其中,所述特征补齐模型的生成器的损失函数为基于样本用户特征的显示分布建模确定的,所述目标隐向量包含目标连续子特征和目标离散子特征;根据所述目标连续子特征确定和所述目标离散子特征,确定所述目标特征的补齐特征。2.根据权利要求1所述的方法,其中,所述补齐特征经所述特征补齐模型的判别器处理之后,所得到的所述判别器的输出值大于预设值,所述预设值的取值大于0.5且小于1。3.根据权利要求1所述的方法,其中,所述根据所述目标连续子特征确定和所述目标离散子特征,确定所述目标特征的补齐特征,包括:将所述目标连续子特征确定为所述补齐特征中的连续特征部分;通过预设函数对所述目标离散子特征处理之后得到所述补齐特征中的离散特征部分;根据所述连续特征部分和所述离散特征部分确定所述补齐特征。4.根据权利要求3所述的方法,其中,所述通过预设函数对所述目标离散子特征处理之后得到所述补齐特征中的离散特征部分,包括:所述目标离散子特征经过softmax函数处理,得到目标中间子特征;所述目标中间子向量经过argmax函数处理,得到所述补齐特征中的离散特征部分。5.根据权利要求1所述的方法,其中,在所述将目标特征输入至特征补齐模型之前,所述方法还包括:确定正类样本,以及确定负类样本;固定对抗生成器的生成器的第一参数不变,通过所述正类样本和所述负类样本,训练所述对抗生成器的判别器;固定所述对抗生成器的判别器的第二参数不变,通过所述负类样本,训练所述对抗生成器的生成器;将训练后的对抗生成器确定为所述特征补齐模型。6.根据权利要求5所述的方法,其中,所述确定正类样本,包括:对第i样本用户特征进行随机元素屏蔽处理,得到所述第i样本用户特征对应的第i缺失特征;将所述第i样本用户特征和所述第i缺失特征确定为第i正类样本,i取值为正整数。7.根据权利要求5所述的方法,其中,所述确定负类样本,包括:对第j样本用户特征进行随机元素屏蔽处理,得到所述第j样本用户特征对应的第j缺失特征;将所述第j缺失特征和随机分布的抽样特征输入至所述抗生成器的生成器,并根据所述抗生成器的生成器的输出的第j生成隐向量确定所述第j样本用户特征对应的第j生成特征;将所述第j样本用户特征和所述第j生成特征确定为第j负类样本,j取值为正整数。8.根据权利要求7所述的方法,其中,所述第j生成特征包括:第j离散特征部分和第j连2CN115081512A权利要求书2/3页续特征部分;所述根据所述抗生成器的生成器的输出的第j生成隐向量确定所述第j样本用户特征对应的第j生成特征,包括:所述第j生成隐向量中的第j离散子特征经过softmax函数处理,得到第j中间子特征;所述第j中间子向量经过argmax函数处理,得到所述第j生成特征中的第j离散特征部分;将所述第j生成隐向量中的第j连续子特征,确定为所述第j生成特征中的第j连续特征部分。9.根据权利要求5至8中任意一项所述的方法,其中,所述通过所述正类样本和所述负类样本,训练所述对抗生