预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109635190A(43)申请公布日2019.04.16(21)申请号201811470188.0H04W4/029(2018.01)(22)申请日2018.11.28(71)申请人四川亨通网智科技有限公司地址610000四川省成都市天府新区兴隆街道场镇社区正街57号1单元2幢4号(72)发明人黄飞胥博李冬(74)专利代理机构成都立新致创知识产权代理事务所(特殊普通合伙)51277代理人谭德兵(51)Int.Cl.G06F16/9535(2019.01)G06F16/9537(2019.01)G06F16/25(2019.01)H04W4/021(2018.01)权利要求书1页说明书4页附图1页(54)发明名称基于位置和行为联合分析的用户特征挖掘方法(57)摘要本发明涉及基于位置和行为联合分析的用户特征挖掘方法,包括S1:在地图上划分特征标的区域范围兴趣点POI;S2:建立“特征标的区域-特征向量”对应表;S3:通过基站、WIFI、手机GPS的定位信息提取用户每天的移动轨迹,通过特征标的区域表示出来;S4:通过用户的移动轨迹生成用户特征向量;S5:区分居住地和工作地:居住地可以判断用户消费能力,工作地可以判断职业;S6.将用户移动轨迹获取的特征与用户上网行为特征求余弦相似度,保留余弦相似度较高的特征作为用户最终特征。本发明基于用户每天的实时位置和移动轨迹,结合地理位置信息和用户途经的POI,找出用户在出行位置上的规律特征,可以挖掘出用户的身份、职业、消费能力,个人喜好等特征。CN109635190ACN109635190A权利要求书1/1页1.基于位置和行为联合分析的用户特征挖掘方法,其特征在于,该方法包括:S1:在地图上划分特征标的区域范围兴趣点POI;S2:建立“特征标的区域-特征向量”对应表;S3:通过基站、WIFI、手机GPS的定位信息提取用户每天的移动轨迹,通过特征标的区域表示出来;S4:通过用户的移动轨迹生成用户特征向量;S5:区分居住地和工作地:居住地可以判断用户消费能力,工作地可以判断职业;S6.将用户移动轨迹获取的特征与用户上网行为特征求余弦相似度,保留余弦相似度较高的特征作为用户最终特征。2.根据权利要求1所述的基于位置和行为联合分析的用户特征挖掘方法,其特征在于,所述用户上网行为特征是根据用户访问URI上网行为数据,通过匹配URI关键字方法,提取出用户基于上网行为的特征。3.根据权利要求2所述的基于位置和行为联合分析的用户特征挖掘方法,其特征在于,所述移动轨迹特征是根据原始的用户话单数据通过ETL,提取出用户实时位置、访问URI核心数据,用户位置数据通过POI匹配,提取出用户基于位置的特征。4.根据权利要求1所述的基于位置和行为联合分析的用户特征挖掘方法,其特征在于,所述移动轨迹还包括旅游移动轨迹的生成以判定该用户的消费水平,其步骤如下:S01:根据用户每天的移动轨迹判断用户的居住地和工作地;S02:确定旅游的类型;当用户的移动轨迹范围超过居住地的半径阈值A且位于阈值B之内时且为期1天以内的则判断为本地游;当用户的移动轨迹范围超过居住地的半径阈值A且位于阈值B之内时且为期2-3天的则判断为省内游;当用户的移动轨迹范围超过居住地的半径阈值B时则判断为国内游;当用户的移动轨迹范位于国外时则判断为国外游;S03:统计一段时间内,用户参与各类旅游的系数,其中,本地游系数为a、省内游系数为b、国内游系数为c、国外游系数为d,则该时间段内用户旅游系数为:Ma+Nb+Sc+Hd,其中M、N、S、H分别为各类旅游的次数;S04:根据用户旅游系数确定用户消费水平。5.根据权利要求4所述的基于位置和行为联合分析的用户特征挖掘方法,其特征在于,所述步骤S02中确定用户为本地游时应排除用户工作地。6.根据权利要求5所述的基于位置和行为联合分析的用户特征挖掘方法,其特征在于,所述步骤S02中还包括一个排除用户出差的步骤:根据用户移动轨迹,当用户到达目的地以后在同一地点停留时间超过阈值C则视为该用户为出差。7.根据权利要求6所述的基于位置和行为联合分析的用户特征挖掘方法,其特征在于,所述阈值A为10-20km、阈值B为该用户居住地省级行政区域的半径。2CN109635190A说明书1/4页基于位置和行为联合分析的用户特征挖掘方法技术领域[0001]本发明涉及用户分析领域,具体涉及一种基于位置和行为联合分析的用户特征挖掘方法。背景技术[0002]大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。大数据作为时下最火热的