预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112256961A(43)申请公布日2021.01.22(21)申请号202011118110.X(22)申请日2020.10.19(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人夏婧吴振宇王建明(74)专利代理机构深圳市明日今典知识产权代理事务所(普通合伙)44343代理人王杰辉曹勇(51)Int.Cl.G06F16/9535(2019.01)G06K9/62(2006.01)G06Q30/02(2012.01)权利要求书3页说明书13页附图2页(54)发明名称用户画像生成方法、装置、设备及介质(57)摘要本申请涉及人工智能技术领域,揭示了一种用户画像生成方法、装置、设备及介质,其中方法包括:获取目标用户的状态特征时间序列及购买行为时间序列,购买行为时间序列携带有目标用户购买产品的产品标识;从预设的模型库中查找与产品标识对应的行为预测模型,其中,行为预测模型是基于马尔科夫决策过程及最大似然逆强化学习得到的模型;将状态特征时间序列及购买行为时间序列输入到与产品标识对应的行为预测模型进行概率预测得到目标用户的行为预测数据;根据行为预测数据,确定目标用户的画像。在人生阶段、人生状态、消费场景发生变化时充分挖掘用户行为,提高用户画像的准确性,提高用户画像颗粒度的精细度。CN112256961ACN112256961A权利要求书1/3页1.一种用户画像生成方法,其特征在于,所述方法包括:获取目标用户的状态特征时间序列及购买行为时间序列,所述购买行为时间序列携带有所述目标用户购买产品的产品标识;从预设的模型库中查找与所述产品标识对应的行为预测模型,其中,所述行为预测模型是基于马尔科夫决策过程及最大似然逆强化学习得到的模型;将所述状态特征时间序列及所述购买行为时间序列输入到所述与所述产品标识对应的行为预测模型进行概率预测得到所述目标用户的行为预测数据;根据所述行为预测数据,确定所述目标用户的画像。2.根据权利要求1所述的用户画像生成方法,其特征在于,所述从预设的模型库中查找与所述产品标识对应的行为预测模型的步骤之前,还包括:获取多个典型用户的样本数据,其中,所述样本数据携带有所述典型用户购买产品的产品标识;基于马尔可夫决策过程确定所述样本数据的效用函数集合;对所述效用函数集合进行最大似然逆强化学习得到所述行为预测模型,所述行为预测模型携带有所述产品标识。3.根据权利要求2所述的用户画像生成方法,其特征在于,所述获取多个典型用户的样本数据,包括:获取多个典型用户的历史数据,所述历史数据包括:典型用户的状态特征数据、典型用户的购买行为数据,所述典型用户的购买行为数据携带有所述典型用户购买产品的产品标识;对所述典型用户的状态特征数据进行时间序列构建得到所述典型用户状态特征时间序列的样本数据;按所述产品标识对所述典型用户购买行为数据进行时间序列构建,得到所述典型用户购买行为时间序列的样本数据。4.根据权利要求2所述的用户画像生成方法,其特征在于,所述样本数据包括:典型用户的状态特征时间序列和购买行为时间序列,所述典型用户的购买行为时间序列携带有所述典型用户购买产品的产品标识;所述基于马尔可夫决策过程确定所述样本数据的效用函数集合的步骤,包括:获取由所述典型用户的状态特征时间序列和购买行为时间序列确定得到的最大价值行为计算公式;采用动态规划方法迭代对所述最大价值行为计算公式进行优化求解,得到目标最大价值行为计算公式;从所述目标最大价值行为计算公式中提取效用函数并将提取的多个效用函数组合为所述效用函数集合。5.根据权利要求2所述的用户画像生成方法,其特征在于,所述对所述效用函数集合进行最大似然逆强化学习得到所述行为预测模型的步骤,包括:对所述效用函数集合中的效用函数进行线性叠加,得到待估计个人效用函数;采用softmax函数对所述待估计个人效用函数进行归一化处理,得到归一化个人效用函数;2CN112256961A权利要求书2/3页采用最大熵逆强化学习方法对所述归一化个人效用函数进行参数估计,得到所述行为预测模型。6.根据权利要求5所述的用户画像生成方法,其特征在于,所述采用最大熵逆强化学习方法对所述归一化个人效用函数进行参数估计,得到所述行为预测模型的步骤,包括:假设存在一个潜在概率分布,在该概率分布下,产生专家轨迹,已知条件为:其中,f表示特征期望(在这里指每一种产品给客户带来的期望效用值,也就是所述待估计个人效用函数Uagent),是专家特征期望(多种产品给客户带来的加权效用值),为每种产品被选中的概率(也就是所述待估计个人效用函数Uagent中的w1,w2,w3,……wn),将问