预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110572813A(43)申请公布日2019.12.13(21)申请号201810484072.6(22)申请日2018.05.19(71)申请人北京融信数联科技有限公司地址100085北京市海淀区上地信息路26号中关村创业大厦10层1004室(72)发明人张广志成立立刘增礼秦星星(74)专利代理机构北京兆君联合知识产权代理事务所(普通合伙)11333代理人初向庆(51)Int.Cl.H04W8/18(2009.01)H04W8/20(2009.01)G06N20/00(2019.01)G06Q30/02(2012.01)权利要求书1页说明书6页附图1页(54)发明名称一种基于移动大数据的手机用户行为相似度分析方法(57)摘要本发明提供一种基于移动大数据的手机用户行为相似度分析方法,利用电信运营商的信令数据,采集一个时间段内一个用户群的移动轨迹信息;统计每个用户在该时间段内在每个扇区中出现的次数或驻留时长PF,以及所有用户在每个扇区中出现的次数或驻留时长的均值GF,计算PF/GF,得到每个用户的PF-IGF值;计算每两个手机用户的PF-IGF值的夹角余弦值,根据所得的夹角余弦值,判定两个用户的行为相似度:夹角余弦值θ越接大,表示这两个手机用户的活动行为轨迹越相近;夹角余弦值的值越小,表示这两个手机用户的活动行为轨迹越不相关。本发明可以用于研究每两个人之间的相似程度,找寻指定范围内每个人的相似人群。CN110572813ACN110572813A权利要求书1/1页1.一种基于移动大数据的手机用户行为相似度分析方法,其特征在于,包括以下步骤:(1)数据采集:利用电信运营商的信令数据,在一个时间段内,对一个用户群中每个用户IMSI识别号所在的基站扇区位置、进出扇区时间信息进行采集,并进行数据清洗;(2)数据预处理:对进出基站缺失信令进行插值补偿;(3)统计PF、GF,计算PF-IGF值:统计每个用户在一定时间段内在每个扇区中出现的次数或驻留时长PF,以及所有用户在每个扇区中出现的次数或驻留时长的均值GF,其中,PF值按天取均值,GF值按人天取均值,并将之归一化;使用归一化之后的PF值和GF值进行PF/GF计算,得到每个用户的PF-IGF值;(4)计算夹角余弦值:采用以下公式计算每两个手机用户的PF-IGF值的夹角余弦值cosθ:其中,Ai表示手机用户A在第i个扇区的PF-IGF值,Bi表示用户B在第i个扇区的PF-IGF值,i=1,2,……n。(5)用户行为相似度判定:根据所得的夹角余弦值cosθ,判定两个用户的行为相似度:夹角余弦值cosθ越接大,表示这两个手机用户的活动行为轨迹越相近;夹角余弦值cosθ的值越小,表示这两个手机用户的活动行为轨迹越不相关。2.根据权利要求1所述的基于移动大数据的手机用户行为相似度分析方法,其特征在于:步骤(1)中所述的时间段按天为单位;所述的用户群,是选定研究范围内的多个移动用户。3.根据权利要求1所述的基于移动大数据的手机用户行为相似度分析方法,其特征在于:步骤(2)所述的对进出基站缺失信令进行插值补偿,具体方法是:如果用户在统计时间段内只有进入某扇区的时间而没有离开该扇区的时间,或者只有离开某扇区的时间而没有进入该扇区的时间,则需要对缺失数据进行插补,插补时间点是该统计时间段的起始时间和结束时间。2CN110572813A说明书1/6页一种基于移动大数据的手机用户行为相似度分析方法技术领域[0001]本发明属于移动大数据应用技术领域,具体涉及一种基于移动大数据的手机用户行为相似度分析方法。背景技术[0002]随着智能手机的普及,促进了移动大数据技术的发展。移动大数据中蕴含了丰富的信息,每个用户都有特殊的移动半径,以及有非常高的概率往返重要的地点。对其进行挖掘,可以发现相似用户的行为模式,而行为模式通常反映了用户的身份和习惯。通过对相似人群的判别,发掘不同用户之间的紧密程度,为精准营销和智能推荐等提供指导。传统的利用移动运营商的信令研究用户行为轨迹相似性的算法都是以密度聚类为主,能够较容易的发现并掌握群体用户的活动共性,但是对于一些个性用户数据容易被当作是噪声点被删除。发明内容[0003]本发明的目的在于针对现实需求,提供一种基于移动大数据的手机用户行为相似度分析方法,可以研究每两个人之间的相似程度,找寻指定范围内每个人的相似人群。[0004]本发明的技术方案如下:[0005]一种基于移动大数据的手机用户行为相似度分析方法,其特征在于,包括以下步骤:[0006](1)数据采集:利用电信运营商的信令数据,在一个时间段内,对一个用户群中每个用户IMSI识别号所在的基站扇区位置、进出扇区时间信息进行采集,并进行数据清洗;[