预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107944913A(43)申请公布日2018.04.20(21)申请号201711164670.7(22)申请日2017.11.21(71)申请人重庆邮电大学地址400065重庆市南岸区南山街道崇文路2号(72)发明人王进杨阳周瑞港孙开伟欧阳卫华邓欣陈乔松(74)专利代理机构重庆市恒信知识产权代理有限公司50102代理人刘小红(51)Int.Cl.G06Q30/02(2012.01)G06K9/62(2006.01)权利要求书2页说明书6页附图3页(54)发明名称基于大数据用户行为分析的高潜在用户购买意向预测方法(57)摘要本发明请求保护一种基于大数据用户行为分析的高潜在用户购买意向预测方法,包括:101数据预处理,对电商用户历史行为数据集进行预处理操作;102样本定义与打标,根据用户历史消费行为,以有交互的用户产品对为关键字构建样本;103训练集测试集划分,采用时间窗口划分法,将历史数据划分为训练集与测试集;104特征构建,对用户的历史行为数据进行特征工程构建;105算法设计与实现,首先对特征群特征选择和对数据集进行不平衡数据的处理,随后本发明提出一种两层模型迭代学习算法预测最终结果。本发明基于时间跨度45天的电商用户历史行为数据,建立预测模型,从而预测未来5天用户是否下单候选商品集合P中的商品。CN107944913ACN107944913A权利要求书1/2页1.一种基于大数据用户行为分析的高潜在用户购买意向预测方法,其特征在于,包括以下步骤:101、数据预处理步骤:对电商用户历史行为数据进行包括去重、删除日成交量大于月平均成交量3倍的异常日期记录和按照各个行为类别重要性赋予其权重在内的预处理操作;102、样本定义与打标步骤:提取5天为跨度的时间窗口交互的用户产品对,以用户id和产品id为索引构建样本,对其进行打标操作;103、训练集与测试集划分步骤:利用时间窗口划分法,将步骤102打标操作后的数据以不同时间粒度划分训练集与测试集;104、特征提取步骤:在特征工程阶段,主要根据用户行为特征群。排名特征群和得分特征群进行特征提取;105、算法设计与实现步骤:对于数据集的类别不平衡分类问题,提出一种基于聚类的相似样本去除算法,包括步骤:首先将原始样本按照标签的不同分为两部分,然后对数量较多的一部分进行聚类操作,接下来在聚类过后的每个类中随机抽样部分样本,最后将不同类中随机抽取的样本合并为新的数据集,抽样比为原始数据中少的一部分数量比多的一部分数量;模型预测阶段提出一种两层模型迭代学习算法去预测用户最终是否会购买商品子集P中的商品,包括步骤:第一层利用前面数据预处理、打标、训练集划分、特征提取后的训练集训练第一层模型,利用第一层模型预测测试集的概率;将测试集预测概率从高到低排序,取排名前1/10为正样本输出,后1/10为负样本输出;将输出的正样本和负样本进行随机采样;将抽样出的正样本加入原训练集作为新增加的正样本,抽样出的负样本加入原训练集作为新增加的负样本;利用重新构建的训练集和xgboost急速梯度提升决策树训练得到第二层模型;重复直到每次输出的正样本数量总和为测试集中实际正样本数量。2.根据权利要求1所述的基于大数据用户行为分析的高潜在用户购买意向预测方法,其特征在于,所述101数据预处理步骤包括:S1011、通过商家平台获取用户历史行为数据,原始数据包括用户基本信息数据、商品数据和用户行为数据,用户基本数据包括用户ID、年龄、性别、用户等级和用户注册日期在内的字段;商品数据包括商品编号、属性1、属性2、属性3、品类ID和品牌ID;用户行为数据包括用户编号、商品编号、行为时间、点击模块编号、type行为类型、品类ID和brand品牌ID,其中行为类型包括1.浏览商品详情页、2.将商品加入购物车、3.从购物车删除商品、4.用户单该商品、5.用户将该商品加入收藏夹和6.用户点击商品链接;S1012、若某日只有下单行为而无添加购物车或无浏览详情页这两种行为,则删除当日下单用户商品对的所有历史交互数据;S1013、将点击商品链接行为和浏览商品详情页行为合并为一种行为,即查看商品;S1014、对原始数据按照user_id,sku_id,type为关键字以分钟为时间粒度去重,减少爬虫重复爬取数据带来的数据冗余;S1015、对原始行为进行转换,按照其相对重要性给其权重,行为类别1浏览商品详情页赋予权重0.1,行为类别2将商品加入购物车赋予权重1,行为类别3从购物车删除商品赋予权重0.2,行为类别4用户下单赋予权重-0.5,行为类别5关注或用户将商品加入收藏夹赋予2CN107944913A权利要求书2/2页权重0.2。3.根据权利要求1或2所述的基于大数据用户