预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113408706A(43)申请公布日2021.09.17(21)申请号202110747531.7G06F40/284(2020.01)(22)申请日2021.07.01G06F40/30(2020.01)(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人王伟帆程晓程刘子奇林宇申月张志强(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人孙欣欣周良玉(51)Int.Cl.G06N3/04(2006.01)G06N3/08(2006.01)G06K9/62(2006.01)G06Q50/00(2012.01)权利要求书5页说明书13页附图5页(54)发明名称训练用户兴趣挖掘模型、用户兴趣挖掘的方法和装置(57)摘要本说明书实施例提供一种训练用户兴趣挖掘模型、用户兴趣挖掘的方法和装置,方法包括:获取多个样本用户构成的关系网络图,关系网络图中具有社交关系的两个样本用户之间具有连接边;根据用户的行为日志特征,确定其初始用户表征向量;将多个样本用户分别对应的初始用户表征向量和关系网络图输入所述图神经网络,得到目标用户的融合用户表征向量;将多个样本用户分别对应的融合用户表征向量输入兴趣分布预测网络,得到各样本用户分别对应的兴趣分布参数;调整网络参数,使得兴趣分布参数所表征的预测兴趣分布与已知的用户兴趣先验分布之间的分布差异减小。对于不活跃的用户,也能有效挖掘用户兴趣。CN113408706ACN113408706A权利要求书1/5页1.一种训练用户兴趣挖掘模型的方法,所述用户兴趣挖掘模型包括图神经网络和兴趣分布预测网络,所述方法包括:获取多个样本用户构成的关系网络图,所述关系网络图中具有社交关系的两个样本用户之间具有连接边;将所述多个样本用户中的任一样本用户作为目标用户,根据所述目标用户的行为日志特征,确定所述目标用户的初始用户表征向量,所述行为日志特征表征了用户在一段时间内访问的对象;将所述多个样本用户分别对应的初始用户表征向量和所述关系网络图输入所述图神经网络,通过所述图神经网络,得到所述目标用户的融合用户表征向量;将所述多个样本用户分别对应的融合用户表征向量输入所述兴趣分布预测网络,得到各样本用户分别对应的兴趣分布参数;通过最小化目标函数,调整所述用户兴趣挖掘模型的网络参数,所述目标函数包括,各样本用户分别对应的兴趣分布参数所表征的预测兴趣分布与已知的用户兴趣先验分布之间的分布差异,所述调整至少使得所述分布差异减小。2.如权利要求1所述的方法,其中,所述行为日志特征通过向量表征,该向量的每个元素对应于一个对象,该元素的数值代表该对象是否被访问。3.如权利要求1所述的方法,其中,所述用户兴趣先验分布为正态分布,所述正态分布具有已知均值和已知协方差;所述将所述多个样本用户分别对应的融合用户表征向量输入所述兴趣分布预测网络,得到各样本用户分别对应的兴趣分布参数,包括:将所述多个样本用户中任一样本用户对应的融合用户表征向量输入所述兴趣分布预测网络,通过所述兴趣分布预测网络输出该样本用户对应的预测均值和预测协方差。4.如权利要求3所述的方法,其中,所述已知均值和已知协方差根据先验的狄利克雷的已知参数而确定,所述已知参数与预先假定的兴趣数目有关。5.如权利要求3所述的方法,其中,所述兴趣分布预测网络包括多层感知器MLP;所述通过所述兴趣分布预测网络输出该样本用户对应的预测均值和预测协方差,包括:通过所述MLP的第一网络层,输出所述预测均值;通过所述MLP的第二网络层,输出所述预测协方差。6.如权利要求3所述的方法,其中,所述分布差异为KL散度,所述KL散度通过所述预测均值、所述预测协方差、所述已知均值和所述已知协方差而确定。7.如权利要求1所述的方法,其中,所述用户兴趣挖掘模型还包括线性映射网络;所述方法还包括:获取各对象分别对应的语义表征向量;将各语义表征向量输入所述线性映射网络,通过所述线性映射网络生成兴趣对象分布矩阵,所述兴趣对象分布矩阵中的同一行元素体现了同一兴趣下各对象分别出现的概率;根据各样本用户分别对应的兴趣分布参数形成用户兴趣预测分布,通过对所述用户兴趣预测分布采样,得到用户兴趣分布矩阵,所述用户兴趣分布矩阵的同一行元素体现了同一样本用户针对各兴趣分别的概率;根据所述兴趣对象分布矩阵和所述用户兴趣分布矩阵,确定各样本用户的预测行为日2CN113408706A权利要求书2/5页志;所述目标函数还包括,根据各样本用户的预测行为日志和行为日志特征确定的似然概率;所述调整所述用户兴趣挖掘模型的网络参数还使得,所述似然概率增大。8.如权利要求7所述的方法,其中,所