预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106897420A(43)申请公布日2017.06.27(21)申请号201710101688.6(22)申请日2017.02.24(71)申请人东南大学地址210096江苏省南京市玄武区四牌楼2号(72)发明人刘志成余锦斌韦煜王宇然陆建王桥(74)专利代理机构南京苏高专利商标事务所(普通合伙)32204代理人王安琪(51)Int.Cl.G06F17/30(2006.01)H04L29/08(2006.01)权利要求书2页说明书4页附图2页(54)发明名称一种基于手机信令数据的用户出行驻留行为识别方法(57)摘要本发明公开了一种基于手机信令数据的用户出行驻留行为识别方法,包括如下步骤:(1)对手机信令数据进行清洗、转换及分割;(2)利用无监督分类方法,设置多个聚类数目,对信令数据单元中的空间点进行聚类,并通过聚类评分指标评价每一个聚类结果,评分高者为最佳聚类;(3)根据最佳聚类得出信令数据单元中所有候选驻留点及相关时间的信息集合;(4)根据时间阈值及各候选驻留点的信息集合,对候选驻留点驻留时长进行计算和筛选,输出每用户每天各驻留点空间位置、到达时间及驻留时长。本发明使用简单方便,具有良好的可扩展性,避免了人为主观判断带来的干扰,避免了市区与郊区基站分布不均匀的特性带来的识别准确率的折中现象。CN106897420ACN106897420A权利要求书1/2页1.一种基于手机信令数据的用户出行驻留行为识别方法,其特征在于,包括如下步骤:(1)对手机信令数据进行清洗、转换及分割;(2)利用无监督分类方法,设置多个聚类数目,对信令数据单元中的空间点进行聚类,并通过聚类评分指标评价每一个聚类结果,评分高者为最佳聚类;(3)根据最佳聚类得出信令数据单元中所有候选驻留点及相关时间的信息集合;(4)根据时间阈值及各候选驻留点的信息集合,对候选驻留点驻留时长进行计算和筛选,输出每用户每天各驻留点空间位置、到达时间及驻留时长。2.如权利要求1所述的基于手机信令数据的用户出行驻留行为识别方法,其特征在于,步骤(1)中,清洗的步骤具体为:获取城市某一段时期内的手机信令数据后,去除其中时空间信息残缺的记录条目;转换的步骤具体为:得到清洗好的信令数据后,将信令记录中的基站编号替换成相应的基站空间坐标,若基站空间坐标为经纬度坐标,则还需将经纬度坐标转换成投影坐标;分割的步骤具体为:得到清洗、转换好的信令数据后,将信令数据先按天做划分,再将数据按用户做划分,从而得到每天当中各用户的所有信令记录条目,以一天当中一个用户的所有信令数据作为一个信令数据单元,记为DataUnit,对每个单元按照接下来的步骤进行计算。3.如权利要求1所述的基于手机信令数据的用户出行驻留行为识别方法,其特征在于,步骤(2)中,利用无监督聚类方法,设置聚类数目依次为2,3,4,……,30,对DataUnit中的空间点进行聚类,并通过聚类评分指标评价每一个聚类结果,评分高者为最佳聚类;对于一个DataUnit,将DataUnit中每条信令记录中基站空间坐标作为一个空间点,利用k-means无监督聚类方法对该信令数据单元中的所有空间点进行聚类,若有坐标相同的空间点均算作不同点;聚类过程中,依次设置k=2,3,…,30,对于每一个k值,使用Dunn指标对聚类结果进行评分,评分最高的k值,则为最佳k值,其所对应的聚类结果为最佳聚类结果。4.如权利要求1所述的基于手机信令数据的用户出行驻留行为识别方法,其特征在于,步骤(3)具体包括如下步骤:(31)生成候选驻留点的信息集合InfoSet:通过步骤(2)获取该DataUnit中空间点的最佳聚类结果后,将DataUnit中的记录条目按照时间先后顺序进行排列,并将每条记录条目的空间点所在的类作为该记录条目的类;将时间顺序上相邻且同类的记录条目合并为一个集合,作为一个候选驻留点的信息集合InfoSet,即:其中,Li表示第i个信息点的空间位置,ti表示第i个信息点的记录时间,|InfoSet|表示驻留点信息集合中信息点的个数;(32)计算候选驻留点相关参数:对于一个候选驻留点的信息集合InfoSet,计算该集合中空间点的平均位置,将其作为该候选驻留点的空间位置,即:将集合中记录条目最早的时间作为该候选驻留点的到达时间tarr,将集合中记录条目最晚的时间作为该候选驻留点的离开时间tdep,用该候选驻留点的离开时间减去到达时间2CN106897420A权利要求书2/2页作为该候选驻留点的驻留时长tdur,即:tarr=t1tdep=t|InfoSet|tdur=tdep-tarr。5.如权利要求4所述的基于手机信令数据的用户出行驻留行为识别方法,其特征在于,步骤(4)具体包括如下