预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113822464A(43)申请公布日2021.12.21(21)申请号202110920381.5(22)申请日2021.08.11(71)申请人大箴(杭州)科技有限公司地址310000浙江省杭州市拱墅区古运路85号古运大厦四层491室(72)发明人刘欢(74)专利代理机构北京中强智尚知识产权代理有限公司11448代理人贾依娇(51)Int.Cl.G06Q10/04(2012.01)G06Q30/02(2012.01)G06N20/00(2019.01)G06K9/62(2006.01)权利要求书2页说明书10页附图3页(54)发明名称用户信息的处理方法及装置、电子设备、存储介质(57)摘要本发明提供了一种用户信息的处理方法及装置、电子设备、存储介质,该方法包括:获取目标用户的用户信息,其中,所述用户信息至少包括用户个人信息和历史金融行为信息;将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习,输出所述目标用户的收入水平信息;其中,所述用户收入水平预测模型为利用含有用户个人信息、历史金融行为信息、信用卡授信额度和历史收入信息的用户样本集训练回归树模型得到。通过本发明,解决了现有的规则模型对用户收入水平预测不准确的技术问题。CN113822464ACN113822464A权利要求书1/2页1.一种用户信息的处理方法,其特征在于,包括:获取目标用户的用户信息,其中,所述用户信息至少包括用户个人信息和历史金融行为信息;将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习,输出所述目标用户的收入水平信息;其中,所述用户收入水平预测模型为利用含有用户个人信息、历史金融行为信息、信用卡授信额度和历史收入信息的用户样本集训练回归树模型得到。2.根据权利要求1所述的方法,其特征在于,在将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习之前,所述方法还包括:获取包含多个用户对应的用户信息的用户样本集,其中,所述用户样本集包括各个用户的用户个人信息、各个用户的历史金融行为信息、各个用户的信用卡授信额度和各个用户的历史收入信息;对所述用户样本集进行数据清洗,得到标准化样本集;利用所述标准化样本集训练所述回归树模型,得到所述用户收入水平预测模型。3.根据权利要求2所述的方法,其特征在于,所述获取包含多个用户对应的用户信息的用户样本集包括:获取包含多个第一用户对应的用户信息的基础用户样本集;基于所述基础用户样本集中各所述第一用户对应的历史收入信息和信用卡授信额度,从所述多个第一用户中筛选出符合预设条件的多个第二用户;其中,所述预设条件为各个用户的历史收入信息位于[信用卡授信额度/n,信用卡授信额度],n为固定常量;从所述基础用户样本集中筛选出包含所述多个第二用户对应的用户信息的筛选用户样本集,作为所述用户样本集。4.根据权利要求2所述的方法,其特征在于,所述用户样本集中每个信息对应一个特征值,所述对所述用户样本集进行数据清洗包括以下至少之一:修正所述用户样本集中存在明显错误的特征值;完善所述用户样本集中存在部分信息遗漏的特征值;对所述用户样本集中的特征值进行特征标准化。5.根据权利要求2所述的方法,其特征在于,所述通过将所述标准化样本集输入所述回归树进行训练,生成所述用户收入水平预测模型包括:步骤A,按照预设比例将所述标准化样本集划分为训练集和测试集;步骤B,将所述训练集输入所述回归树模型进行训练,生成预训练模型;步骤C,通过将所述测试集中的用户个人信息和历史金融行为信息输入所述预训练模型进行特征学习,输出所述测试集对应的收入水平信息;步骤D,根据所述测试集对应的收入水平信息和所述测试集中的历史收入信息计算所述预训练模型的误差;循环执行上述步骤A、步骤B、步骤C及步骤D,直到所述误差取得最小值时,结束对所述预训练模型的迭代训练,并将所述误差取最小值时对应的预训练模型作为所述用户收入水平预测模型。6.根据权利要求5所述的方法,其特征在于,在将所述训练集输入所述回归树模型进行2CN113822464A权利要求书2/2页训练之前,所述方法还包括:利用损失函数搭建所述回归树模型;其中,所述回归树模型通过以下公式表达:其中,l(yi,y′i)是损失函数,用于计算所述误差,yi为样本集中用户实际的历史收入信息,y′i为用户收入水平预测模型输出的用户收入水平信息,Ω(f(t))为损失函数复杂度,Cons为常数项。7.根据权利要求1‑6中任一项所述的方法,其特征在于,所述回归树模型包括梯度提升决策树GBDT模型。8.一种用户信息的处理装置,其特征在于,包括:第一获取模块,用于获取目标用户的用户信息,其中,所述用户信息至少包括用户个人信息和历史金融行为信息;学习模