预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114118192A(43)申请公布日2022.03.01(21)申请号202010903751.X(22)申请日2020.09.01(71)申请人中国移动通信有限公司研究院地址100053北京市西城区宣武门西大街32号申请人中国移动通信集团有限公司(72)发明人江洁马燕张子淳(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人钟文聪张颖玲(51)Int.Cl.G06K9/62(2022.01)权利要求书2页说明书10页附图5页(54)发明名称用户预测模型的训练方法、预测方法、装置及存储介质(57)摘要本发明公开了一种用户预测模型的训练方法、预测方法、装置及存储介质。该训练方法包括:对样本集数据进行数据预处理;对所述数据预处理后的样本集数据进行特征提取,得到用于描述各用户的特征数据集;对所述特征数据集进行特征选择,得到目标特征集;基于所述目标特征集训练用户预测模型,得到训练好的用户预测模型;所述用户预测模型包括至少两个基模型和连接所述至少两个基模型的元模型。本发明实施例可以得到多维度的有效用户特征;且用户预测模型包括至少两个基模型和连接所述至少两个基模型的元模型,从而可以对多个用户的目标特征集,融合多种基模型进行预测,提高预测的准确率。CN114118192ACN114118192A权利要求书1/2页1.一种用户预测模型的训练方法,其特征在于,包括:对样本集数据进行数据预处理,所述样本集数据包括预设数量个用户的移动通信相关的用户数据及各用户的标签信息,所述标签信息用于表征所述用户为以下之一:同网升级的目标用户、异网升级的目标用户、非目标用户;对所述数据预处理后的样本集数据进行特征提取,得到用于描述各用户的特征数据集;对所述特征数据集进行特征选择,得到目标特征集;基于所述目标特征集训练用户预测模型,得到训练好的用户预测模型;其中,所述用户预测模型包括至少两个基模型和连接所述至少两个基模型的元模型。2.根据权利要求1所述的方法,其特征在于,基于所述目标特征集训练用户预测模型,得到训练好的用户预测模型,包括:将所述样本集数据基于用户划分为训练数据集和测试数据集,并确定所述训练数据集中各用户的目标特征集和所述测试数据集中各用户的目标特征集;对所述用户预测模型中的各所述基模型,基于交叉验证法得到所述训练数据集的第一预测结果和所述测试数据集的第二预测结果;基于各所述基模型的所述第一预测结果和所述第二预测结果对所述用户预测模型中的所述元模型进行训练,得到训练好的用户预测模型。3.根据权利要求2所述的方法,其特征在于,所述基于各所述基模型的所述第一预测结果和所述第二预测结果对所述用户预测模型中的所述元模型进行训练,包括:将各所述基模型的所述第一预测结果作为训练集,训练所述元模型,得到训练后的所述用户预测模型;将各所述基模型的所述第二预测结果作为测试集,评估所述训练后的所述用户预测模型的性能。4.根据权利要求2所述的方法,其特征在于,所述对所述用户预测模型中的各所述基模型,基于交叉验证法得到所述训练数据集的第一预测结果和所述测试数据集的第二预测结果,包括:将所述训练数据集分为五份,基于五折交叉验证法,得到各所述基模型的所述训练数据集的第一预测结果和所述测试数据集的第二预测结果。5.根据权利要求1所述的方法,其特征在于,所述特征数据集包括以下至少之一:用户基本属性特征、用户工作信息特征、设备使用特征、用户消费偏好特征、用户通信特征、用户上网行为特征及用户社交信息特征。6.根据权利要求1所述的方法,其特征在于,所述对所述特征数据集进行特征选择,得到目标特征集,包括:将所述特征数据集中与所述标签信息之间的最大互信息值系数MIC值最大的第一特征加入目标特征集;遍历所述特征数据集中余下的其他特征,选取分别与所述第一特征、所述标签信息间的MIC值的均值最大的特征加入所述目标特征集;评估当前所述目标特征集的模型训练性能是否大于上一次所述目标特征集的模型训练性能,若是,则继续所述遍历所述特征数据集中余下的其他特征,选取分别与所述第一特2CN114118192A权利要求书2/2页征、所述标签信息间的MIC值的均值最大的特征加入所述目标特征集,直至当前所述目标特征集的模型训练性能小于或等于上一次所述目标特征集的模型训练性能,停止特征选择,并删除所述目标特征集中最后一次加入的特征。7.一种用户预测方法,其特征在于,包括:将待预测用户的目标特征集输入如权利要求1至6任一所述方法训练得到的用户预测模型中,得到待预测用户的分类结果。8.一种用户预测模型的训练装置,其特征在于,包括:预处理模块,用于对样本集数据进行数据预处理,所述样本集数据包括预设数量个用户的移动通信相关的用户数据及