预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115187312A(43)申请公布日2022.10.14(21)申请号202210931243.1G06N5/00(2006.01)(22)申请日2022.08.04G06N20/20(2019.01)(71)申请人新疆大学地址830046新疆维吾尔自治区乌鲁木齐市天山区胜利路666号(72)发明人赵晖杨立立邵宇颉(74)专利代理机构吉林长春新纪元专利代理有限责任公司22100专利代理师王怡敏(51)Int.Cl.G06Q30/02(2012.01)G06Q30/06(2012.01)G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书15页附图3页(54)发明名称基于深度学习的客户流失预测方法及系统(57)摘要本发明涉及一种基于深度学习的客户流失预测方法及系统,属于人工智能领域。通过用户在电商平台使用的相关用户日志,抽取相关属性,构建用户行为特征信息。根据用户流失原因构建了多个维度的用户行为特征,使用皮尔逊系数与卡方检验法确定最终用户特征。针对用户兴趣变化和用户全局行为习惯对流失预测不同的影响,提出了用户动静态融合策略。搭建XGB‑LGCNN预测模型,利用分类器模型进行用户流失预测。解决了传统机器学习方法在预测用户流失概率时效率低、不准确的问题。能够准确判断用户流失的概率,提高流失判断精度,降低人工盲目验证及统计的成本。CN115187312ACN115187312A权利要求书1/2页1.一种基于深度学习的客户流失预测方法,其特征在于:包括如下步骤:步骤1、数据来源:通过获取电商平台记录用户行为的日志数据,抽取特征属性,构建用户行为特征信息;分析引起用户流失的不同原因构建用户流失特征,从“个人画像”、“购买力”、“参与度”、“忠诚度”四个维度构建用户的流失特征,不同的维度代表用户与平台之间不同的关系,其中用户流失特征构建细节信息如下:个人画像:用户id、性别、注册时长、年龄;购买力:最近一次消费、每单平均消费金额、商品平均消费金额、消费总金额、消费总数量、消费总次数;参与度:登录总天数、登录总次数、点击商品总次数;忠诚度:最后一次登录、登录频率、使用总时长;步骤2、特征处理:对步骤1中获取的用户信息数据进行预处理,预处理环节如下:2.1、删除离群值较大或明显不合理的用户特征信息数据;2.2、根据用户特征空值的情况与填充值的真实物理意义来填充数值空值;2.3、删除噪声数据,以免影响最终模型流失预测的准确性;2.4、将用户特征中的类别变量进行数值化处理;2.5、删除无效用户特征信息数据;2.6、数据标准化处理,使用z‑score函数对用户数值特征进行处理;根据用户流失原因构建了多个维度的用户行为特征,使用皮尔逊系数与卡方检验法确定最终用户特征,选出对于用户流失预测更有效的特征,去除了冗余或者干扰性强的特征;针对用户兴趣变化和用户全局行为习惯对流失预测不同的影响,提出了用户动静态融合策略;对用户行为特征进行分类,划分用户动态与静态特征,形成需要的用户行为特征数据集,并按照比例分为训练样本和测试样本;步骤3、模型构建:搭建极限梯度提升树‑长短期记忆门控卷积神经网络预测模型,所述极限梯度提升树‑长短期记忆门控卷积神经网络预测模型由长短期记忆门控卷积神经网络模型与极限梯度提升树组成,长短期记忆门控卷积神经网络模型由长短期记忆神经网络、门机制及卷积神经网络的网络层以及最后的全连接层组成;极限梯度提升树是梯度提升决策树的一类变种,长短期记忆门控卷积神经网络模型用于处理用户动态特征,极限梯度提升树用于处理用户静态特征,最后通过全连接层融合,得到更好的特征数据;步骤4、模型训练:利用步骤2中选出的最终用户流失特征,使用训练样本对搭建极限梯度提升树‑长短期记忆门控卷积神经网络预测模型进行训练,根据训练模型预测结果与测试样本中的对应的真实标签作比较,评估训练模型的预测准确率与F1值,选取准确率较高的训练好的极限梯度提升树‑长短期记忆门控卷积神经网络预测模型作为实际应用中的模型;步骤5、进行用户流失预测:将用户数据输入到经步骤4训练好的极限梯度提升树‑长短期记忆门控卷积神经网络预测模型,得到待测用户的流失概率。2.根据权利要求1所述的基于深度学习的客户流失预测方法,其特征在于:所述的步骤1获取的用户信息中,“消费总金额”、“消费总数量”、“登录总天数”、“登录频率”、“点击商品总次数”、“使用总时长”为动态特征数据,除了获取整个观察期的总数之外还需要分组处理,数据集记录观察期为90天,按规定时间粒度7天一个分组,分为13组。2CN115187312A权利要求书2/2页3.根据权利要求1所述的基于深度学习的客户流失预测