预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110555717A(43)申请公布日2019.12.10(21)申请号201910687675.0(22)申请日2019.07.29(71)申请人华南理工大学地址510640广东省广州市天河区五山路381号(72)发明人程锐张艳青杨漫瑶(74)专利代理机构广州市华学知识产权代理有限公司44245代理人林梅繁(51)Int.Cl.G06Q30/02(2012.01)G06Q30/06(2012.01)权利要求书2页说明书7页附图2页(54)发明名称基于用户行为特征挖掘用户潜在购买商品和品类的方法(57)摘要本发明属于用户行为分析和数据挖掘领域,涉及一种基于用户行为特征挖掘用户潜在购买商品和品类的方法,对预处理后的数据进行数据编码,并进行特征工程处理,得到用户行为特征数据;对样本数据进行正负样本分析与分类,将正负样本通过动态欠采样处理生成多个样本子集,作为训练的正负样本数据;通过正负样本数据对决策树模型进行训练,训练出多个单预测模型,再通过stacking方式对单预测模型进行融合,生成多个融合预测模型;基于多个融合预测模型对用户潜在购买商品和品类进行预测,对各个融合预测模型的预测结果进行处理分析,得到带有权重的用户潜在购买商品和品类。本发明能帮助商户发掘高潜在购买意向的用户,提高营销的用户消费转换率。CN110555717ACN110555717A权利要求书1/2页1.基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,包括:数据清洗与数据预处理,得到预处理后的数据;对预处理后的数据进行数据编码,并提取基本特征、统计类特征、时间间隔类特征、计算类特征,对提取的特征通过过滤法进行特征重要性评估,筛选出重要特征和冗余特征,在进行特征重要性评估过程,针对某些用户行为离预测时间越近对结果影响越大,引入时间衰退理论,对数据特征进行加权处理,得到用户行为特征数据;对样本数据进行正负样本分析与分类,将正负样本通过动态欠采样处理生成多个样本子集,作为训练的正负样本数据;通过正负样本数据对决策树模型进行训练,训练出多个单预测模型,再通过stacking方式对单预测模型进行融合,生成多个融合预测模型;利用融合预测模型进行预测,将预测结果与期望值进行对比,反馈给决策树模型进行参数调整和模型再训练,直到得出最优的模型参数;基于多个融合预测模型对用户潜在购买商品和品类进行预测,对各个融合预测模型的预测结果进行处理分析,得到带有权重的用户潜在购买商品和品类。2.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,过滤法指的是采用相关系数法对每个特征按照指标进行打分,这个评分即代表着这个特征的重要性,然后依据评分对特征进行排序。3.根据权利要求2所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,采用卡方过滤计算每个非负特征和标签之间的卡方统计量,并依照卡方统计量由高到低为特征排名,选出前K个分数最高的特征的类,借此除去最可能独立于标签,与分类目的无关的特征。4.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,样本数据包括某个用户对于某个商品在一段时间内的行为特征数据、商品、用户本身的特征数据。5.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,动态欠采样处理是针对样本数量过大的那部分样本,通过一定的方法抽取部分样本,以协调其与其他样本的比例不均衡情况。6.根据权利要求5所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,通过随机抽取的方式,从负样本中抽取一定数量的子样本,与正样本组合成新的样本集。7.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,采用的决策树模型为RF和GDBT算法。8.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,多个单预测模型通过stacking方式生成融合预测模型过程包括:在处理好正负样本后,生成n个样本训练集train_x、…、train_y和测试集test;①选择一种未经训练的决策树模型;②抽取其中n-1份作为小的训练集s_train_x、…、s_train_y,另外一份作为小的测试集s_test,测试集test不变;③以s_train_x、…、s_train_y训练决策树模型,训练出的模型预测s_test得出对应的2CN110555717A权利要求书2/2页s_pred,再预测test得出y_pred;④在训练集再选择另外一份作为小的测试集s_test_x,其他n-1份作为训练集训练决策树模型;⑤重复②、③、④步骤n次,得到n个s_pred和n