预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112559587A(43)申请公布日2021.03.26(21)申请号202011418926.4(22)申请日2020.12.06(71)申请人复旦大学地址200433上海市杨浦区邯郸路220号(72)发明人孙未未单张卿(74)专利代理机构上海正旦专利代理有限公司31200代理人陆飞陆尤(51)Int.Cl.G06F16/2458(2019.01)G06F16/29(2019.01)G06F16/36(2019.01)权利要求书2页说明书5页附图1页(54)发明名称基于城市语义图谱的轨迹时空语义模式提取方法(57)摘要本发明属于轨迹计算技术领域,具体为一种基于城市语义图谱的轨迹时空语义模式提取方法。本发明包括:预处理:对轨迹数据进行位置与时间判定,对轨迹数据进行精简,只保留驻留点;语义判别:利用预处理阶段得到的驻留点进行语义信息判别;按照城市语义图谱中的聚类归属进行空间频次权重的加总,最高权重类别的语义标签定义为该驻留点语义;模式提取:将轨迹序列看成带有语义标签的时空驻留点序列,对海量的序列进行基于标签比较的高频序列检验和时空聚合分析,最后提取得到轨迹的时空语义模式。本发明基于城市语义图谱识别海量轨迹语义信息,克服了传统网格化轨迹模式提取的边界与粒度限制,具有时空语义模式提取数量和精度上的明显优势。CN112559587ACN112559587A权利要求书1/2页1.一种基于城市语义图谱的轨迹时空语义模式提取方法,其特征在于,具体步骤分为如下三个阶段:(一)预处理阶段:对轨迹数据进行位置与时间判定,寻找驻留点;随后对轨迹数据进行精简,只保留驻留点;(二)语义判别阶段:利用已经获得的城市语义图谱对预处理阶段得到的驻留点进行语义信息判别;按照城市语义图谱中的聚类归属进行空间频次权重的加总,最高权重类别的语义标签定义为该驻留点语义;(三)模式提取阶段:将轨迹序列看成带有语义标签的时空驻留点序列,对海量的序列进行基于标签比较的高频序列检验和时空聚合分析,最后提取得到轨迹的时空语义模式。2.根据权利要求1所述的基于城市语义图谱的轨迹时空语义模式提取方法,其特征在于,预处理阶段的具体操作流程为:对轨迹数据进行位置与时间判定,寻找在连续的30分钟时间以上的,位置变动在50m距离内的GPS点,这些点的几何中心位置定义为驻留点,认定为出行者在此地活动,到访了附近的POI点;将轨迹中所有的非驻留点删去,所有轨迹被精简成驻留点的时空迁移序列。3.根据权利要求2所述的基于城市语义图谱的轨迹时空语义模式提取方法,其特征在于,语义判别阶段利用已经获得的城市语义图谱对预处理阶段得到的驻留点进行语义信息判别;对于城市语义图谱中的每个POI点pI,其到访频次定义为:I其中,需要根据点分布提前计算出三倍标准差距离R3σ,利用所有距离p点R3σ以内的驻I留点sp累计频次,d(sp,p)指两点之间的距离;对于任意一个驻留点sp0,计算一个高斯分布系数:I来衡量驻留点和POI点之间的远近关系,则对于任意一对驻留点sp0和POI点p,计算其II空间频次权重为pop(p)×||p,sp0||;对于驻留点sp0附近的所有POI点,按照其在城市语义图谱中的聚类归属进行加总和投票,每种聚类归属类别的投票权重定义为所属POI点的空间频次权重之和,投票权重最高的类别的语义标签可以定义为该驻留点sp0的语义信息。4.根据权利要求3所述的基于城市语义图谱的轨迹时空语义模式提取方法,其特征在于,模式提取阶段,具体操作步骤为:(1)序列生成;采用PrefixSpan算法对轨迹序列的语义标签进行高频序列提取;(2)空间提取:对于高频语义标签序列模式中的每一个标签,都对应一个不少于支持度的时空驻留点集合;对于每一个驻留点集合,进行空间聚集点判断;由于这些驻留点都位于城市街区范围内,可以利用城市街道路网信息,先对其进行街区划分,位于同一个街区的驻留点组成一个子空间;在划分后的街区子空间中,计算任何一对驻留点之间的距离,如果距离小于GPS误差精度∈,则认为两点之间存在一条连接边;所有的驻留点和连接边构成图结构,利用图论算法求解图中的连通分量即子图;所有驻留点数量小于支持度的连通分量;剩余每一个连通分量的驻留点几何中心视为代表点;将这些代表点作为时空模式的空间位置2CN112559587A权利要求书2/2页数据提取出来;(3)时序提取;对于空间提取步骤中提取出的所有代表点,进行时序关联提取;序列生成步骤中的每一高频语义标签序列模式pa,假设其长度为m,即其包含的所有轨迹的长度为m,对其中所有轨迹逐一进行扫描;假设当前扫描到任一轨迹STi∈pa的第k(1≤k≤m)个点,则从空间提取步骤的结果中推导得到轨迹集合Ck,存储所