预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111222686A(43)申请公布日2020.06.02(21)申请号201911151541.3G06Q50/10(2012.01)(22)申请日2019.11.21(71)申请人施甸县保施高速公路投资开发有限公司地址678200云南省保山市施甸县甸阳镇甸阳西路秧田045号(72)发明人段军吴金锁金飞王少飞方义明杨志华马璐杨林陈芳俞山川闻乃军张家颖(74)专利代理机构北京海虹嘉诚知识产权代理有限公司11129代理人吕小琴(51)Int.Cl.G06Q10/04(2012.01)G06K9/62(2006.01)权利要求书2页说明书4页附图2页(54)发明名称优化高速公路服务区业态的方法(57)摘要本发明提供一种优化高速公路服务区业态的方法,所述方法包括以下步骤:S1:获取N天的目标高速公路服务区用户的消费数据,所述消费数据至少包括商品名称、采购时间和采购金额,所述N为大于1的整数;S2:对所述消费数据进行预处理获得近度R、频率F和强度M;S3:根据步骤S2所述的近度R、频率F和强度M,采用K-Means聚类算法对用户进行分类;S4:挖掘各个类别的用户的消费行为,获得用户消费偏好的集合。本申请利用聚类算法对客户进行分类,随后根据不同类别的客户,以购物数据中客户购买的产品为事务集,基于FP-Growth算法确定该类客户的购物产品的频繁项集,从而得知各类客户购买频次最多的产品,为高速公路服务提供数据参考。CN111222686ACN111222686A权利要求书1/2页1.一种优化高速公路服务区业态的方法,其特征在于:所述方法包括以下步骤:S1:获取N天的目标高速公路服务区用户的消费数据,所述消费数据至少包括商品名称、采购时间和采购金额,所述N为大于1的整数;S2:对所述消费数据进行预处理获得近度R、频率F和强度M;S3:根据步骤S2所述的近度R、频率F和强度M,采用K-Means聚类算法对用户进行分类;S4:挖掘各个类别的用户的消费行为,获得用户消费偏好的集合。2.根据权利要求1所述优化高速公路服务区业态的方法,其特征在于:所述近度R、频率F和强度M采用如下方法确定:所述近度R表示用户最后一次在目标服务区消费距离观测时间结束日期的天数;R=A-B,其中,R表示近度,A表示观测时间结束日期,B表示用户最后一次在目标服务区消费的日期;所述频率F表示在观测时间内用户在目标服务区消费的次数;所述强度M表示在观测时间内用户消费金额的总和;其中,M表示强度,Si表示用户一次消费的总额,F表示观测时间内用户在目标服务区消费的次数。3.根据权利要求1所述优化高速公路服务区业态的方法,其特征在于:所述步骤S3包括:S31:从近度R、频率F和强度M中随机选取三个数据作为初始的聚类中心;S32:计算每个数据到所述初始聚类中心的距离,并将数据归类到距离初始聚类中心距离最小的初始聚类中心的类;S33:重复步骤S302,直至所有的数据均被归类;S34:计算各个步骤S302获得的各个类的聚类中心;S35:判断步骤S304计算的聚类中心与初始聚类中心是否相等,若是,则分类结束;若否,则进入步骤S302。4.根据权利要求3所述优化高速公路服务区业态的方法,其特征在于:所述步骤S302中计算每个数据到初始聚类中心的距离采用欧氏距离确定,其中,d12表示两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离,其中,X1k表示n维向量a的元素,X2k表示n维向量b的元素,k表示变量,n表示n维向量a或n维向量b的元素的个数。5.根据权利要求3所述优化高速公路服务区业态的方法,其特征在于:所述K-means算法中K的取值为4,即将服务区用户根据价值依次划分为高价值保留客户、一般价值发展客户、低价值挽留客户和无价值其他客户4个类别。6.根据权利要求1所述优化高速公路服务区业态的方法,其特征在于:所述步骤S4采用FP-Growth算法对用户的消费行为偏好进行挖掘,所述步骤S4具体为:S41:构建FP-tree;2CN111222686A权利要求书2/2页S42:挖掘频繁项集。7.根据权利要求6所述优化高速公路服务区业态的方法,其特征在于:所述步骤S41具体包括:S411:构建消费数据中用户ID为特征项的事物集,获得用户ID为特征项对应的N个事物集;S412:扫描所述N个事物集,确定每个特征项在所述N个事物集出现的总次数,并将所述总次数标记为每个特征项的支持度;S413:获取预先设置的最小支持度,删除支持度小于所述预先设置的最小支持度的特征项,并按支持度降序的顺序重新排列剩余的特征项;S414:构造项头表和节点链表,最终得到FP-tree。8.根据权利要求6所述