预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109858532A(43)申请公布日2019.06.07(21)申请号201910041707.X(22)申请日2019.01.16(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人吴欢王晶晶(74)专利代理机构深圳中一专利商标事务所44237代理人高星(51)Int.Cl.G06K9/62(2006.01)G06F16/955(2019.01)G06F16/903(2019.01)权利要求书4页说明书11页附图5页(54)发明名称一种用户画像方法、装置、可读存储介质及终端设备(57)摘要本发明属于计算机技术领域,尤其涉及一种用户画像方法、装置、计算机可读存储介质及终端设备。所述方法获取用户在预设的各个评估维度上的特征信息,并根据所述特征信息构造所述用户的特征向量;从预设的历史用户信息数据库中选取N个训练样本,并组成训练样本集合;使用所述用户的特征向量和所述训练样本集合对预设的分类器集合中的各个分类器进行LN-1轮筛选,每轮筛选从所述分类器集合中筛选出一个分类器,并确定出所述用户在一个标签维度上的标签值。通过这样的方式,先筛选出的分类器确定出的标签值会参与到后筛选出的分类器的处理过程之中,从而将各个分类器有机的耦合在一起,充分利用了这些分类器之间的关联性,提升了用户画像的准确率。CN109858532ACN109858532A权利要求书1/4页1.一种用户画像方法,其特征在于,包括:获取用户在预设的各个评估维度上的特征信息,并根据所述特征信息构造所述用户的特征向量;从预设的历史用户信息数据库中选取N个训练样本,并组成训练样本集合,N为正整数;使用所述用户的特征向量和所述训练样本集合对预设的分类器集合中的各个分类器进行LN-1轮筛选,每轮筛选从所述分类器集合中筛选出一个分类器,并确定出所述用户在一个标签维度上的标签值,所述分类器集合中包括两个以上的不同分类器,每个分类器用于确定一个标签维度上的标签值,LN为标签维度的总数;根据所述用户在各个标签维度上的标签值构造所述用户的标签向量。2.根据权利要求1所述的用户画像方法,其特征在于,所述训练样本集合中的每个训练样本均包括一个历史用户的特征向量和标签向量,即:Samplen=(EigenVecn,LabelVecn)其中,Samplen为所述训练样本集合中的第n个训练样本,1≤n≤N,EigenVecn为第n个训练样本的特征向量,且:EigenVecn=(EigenValn,1,EigenValn,2,...,EigenValn,en,...,EigenValn,EN),EigenValn,en为第n个训练样本的特征向量在第en个评估维度上的特征信息,1≤en≤EN,EN为评估维度的总数,LabelVecn为第n个训练样本的标签向量,且:LabelVecn=(LabelValn,1,LabelValn,2,...,LabelValn,ln,...,LabelValn,LN),LabelValn,ln为第n个训练样本的标签向量在第ln个标签维度上的标签值,1≤ln≤LN。3.根据权利要求2所述的用户画像方法,其特征在于,使用所述用户的特征向量和所述训练样本集合对预设的分类器集合中的各个分类器进行第t轮筛选的过程包括:根据下式对所述用户的特征向量进行扩展:ExTgtEgVect=(ExTgtEgVect-1,SelTgtLbValt-1)其中,ExTgtEgVect为所述用户在第t轮筛选过程中扩展得到的特征向量,特殊地,设置ExTgtEgVec0=TgtEgVec,TgtEgVec为所述用户的特征向量,SelTgtLbValt为所述用户在第t轮筛选过程中确定出的标签值,特殊地,设置根据下式对所述训练样本集合的各个训练样本的特征向量进行扩展:ExEigenVect,n=(ExEigenVect-1,n,SelLabelValt-1,n)其中,ExEigenVect,n为第n个训练样本在第t轮筛选过程中扩展得到的特征向量,1≤t≤LN-1,特殊地,设置ExEigenVec0,n=EigenVecn,SelLabelValt,n为第n个训练样本与第t轮筛选过程中筛选出的分类器对应的标签值,特殊地,设置从所述分类器集合中分别提取出各个待筛选的分类器,其中,待筛选的分类器的总数为SNt,且SNt=LN-t+1;根据所述用户扩展得到的特征向量与各个训练样本扩展得到的特征向量分别计算各个待筛选的分类器的样本平均距离;选取样本平均距离最小的分类器作为第t轮筛选过程中筛选出的分类器。4.根据权利要求3所述的用户画像方法,其特征在于,所述根据所