预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106682938A(43)申请公布日2017.05.17(21)申请号201611202440.0(22)申请日2016.12.23(71)申请人广州帷策智能科技有限公司地址510000广东省广州市天河区体育东路136,138号1308单元(72)发明人江颖黄仕玲吴国斌张馨钟山(74)专利代理机构北京联瑞联丰知识产权代理事务所(普通合伙)11411代理人张清彦(51)Int.Cl.G06Q30/02(2012.01)权利要求书2页说明书7页附图3页(54)发明名称大数据精准营销模型的构建方法及装置(57)摘要本发明公开了一种大数据精准营销模型的构建方法及装置,方法包括:读取建模数据样本文件;按照设定的比例将建模数据样本划分为训练样本和测试样本;进行缺失值补全;对连续型的影响变量做离散化处理;计算各属性的信息熵,并对数据进行替换;固定建模数据样本文件的最后一列为目标变量,训练大数据精准营销模型;对模型进行测试,利用AUC值来判断模型的好坏;读取目标数据样本文件;对目标数据样本进行缺失值补全;对目标数据样本中连续型的影响变量做离散化替换;对离散型数据做离散化替换;计算每一个目标数据的概率值;输出概率列表。本发明的模型效果更加精准、中间不需要任何的人工操作、操作较为简便、非分析人员也能使用模型。CN106682938ACN106682938A权利要求书1/2页1.一种大数据精准营销模型的构建方法,其特征在于,包括如下步骤:A)读取建模数据样本文件并输入建模数据样本;所述建模数据样本文件包含影响变量和目标变量;B)按照设定的比例将所述建模数据样本划分为训练样本和测试样本;C)采取众数的方法对所述训练样本和测试样本进行缺失值补全;D)对所述训练样本中的连续型的影响变量做离散化处理;E)计算离散化处理后的每个影响变量中各属性的信息熵,并对缺失值补全后的数据进行替换,并存储替换规则;F)采用二元逻辑回归的方法固定所述建模数据样本文件的最后一列为目标变量,其他为自变量,利用所述训练样本训练所述大数据精准营销模型;G)利用所述测试样本对所述大数据精准营销模型进行测试,并输出测试结果,利用AUC值来判断所述大数据精准营销模型的好坏;H)读取目标数据样本文件并输入目标数据样本;所述目标数据样本文件包含影响变量;I)利用统计的方法对所述目标数据样本进行缺失值补全;J)对所述目标数据样本中连续型的影响变量按照所述建模数据样本的规则做离散化替换,替换成离散型数据;K)按照所述替换规则对所述离散型数据做离散化替换;L)计算所述目标数据样本中每一个目标数据的概率值;M)输出概率列表。2.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,所述步骤A)进一步包括:A1)读取建模数据样本文件,并判断是否找到所述建模数据样本文件,如是,执行步骤A2);否则,退出;A2)校验写入的所述建模数据样本是否具有所述目标变量且所述目标变量为二元变量,如是,执行步骤B);否则,报错后返回步骤A1)。3.根据权利要求1或2所述的大数据精准营销模型的构建方法,其特征在于,所述步骤H)进一步包括:H1)读取所述目标数据样本文件,并判断是否找到所述建模数据样本文件,如是,执行步骤H2);否则,退出;H2)校验所述目标数据样本文件中的字段与所述建模数据样本是否一致,如是,执行步骤I);否则,报错后返回步骤H1)。4.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,所述设定的比例为7:3。5.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,当所述AUC值小于0.6时,确定所述大数据精准营销模型的测试结果不好。6.一种实现如权利要求1所述的大数据精准营销模型的构建方法的装置,其特征在于,包括:建模数据样本输入单元:用于读取建模数据样本文件并输入建模数据样本;所述建模2CN106682938A权利要求书2/2页数据样本文件包含影响变量和目标变量;样本划分单元:用于按照设定的比例将所述建模数据样本划分为训练样本和测试样本;样本缺失值补全单元:用于采取众数的方法对所述训练样本和测试样本进行缺失值补全;离散处理单元:用于对所述训练样本中的连续型的影响变量做离散化处理;信息熵计算替换单元:用于计算离散化处理后的每个影响变量中各属性的信息熵,并对缺失值补全后的数据进行替换,并存储替换规则;模型训练单元:用于采用二元逻辑回归的方法固定所述建模数据样本文件的最后一列为目标变量,其他为自变量,利用所述训练样本训练所述大数据精准营销模型;测试单元:用于利用所述测试样本对所述大数据精准营销模型进行测试,并输出测试结果,利用AUC值来判断所述大数据精准营销模型的好坏;目标数据样本输入单元:用于读取