基于城市语义图谱的轨迹时空语义模式提取方法-豆柴文库

基于城市语义图谱的轨迹时空语义模式提取方法.pdf

2023-11-10

10金币

590KB

9页

努力****采萍

实名认证

内容提供者

1/9

2/9

3/9

4/9

5/9

6/9

7/9

8/9

9/9

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112559587A(43)申请公布日2021.03.26(21)申请号202011418926.4(22)申请日2020.12.06(71)申请人复旦大学地址200433上海市杨浦区邯郸路220号(72)发明人孙未未单张卿(74)专利代理机构上海正旦专利代理有限公司31200代理人陆飞陆尤(51)Int.Cl.G06F16/2458(2019.01)G06F16/29(2019.01)G06F16/36(2019.01)权利要求书2页说明书5页附图1页(54)发明名称基于城市语义图谱的轨迹时空语义模式提取方法(57)摘要本发明属于轨迹计算技术领域，具体为一种基于城市语义图谱的轨迹时空语义模式提取方法。本发明包括：预处理：对轨迹数据进行位置与时间判定，对轨迹数据进行精简，只保留驻留点；语义判别：利用预处理阶段得到的驻留点进行语义信息判别；按照城市语义图谱中的聚类归属进行空间频次权重的加总，最高权重类别的语义标签定义为该驻留点语义；模式提取：将轨迹序列看成带有语义标签的时空驻留点序列，对海量的序列进行基于标签比较的高频序列检验和时空聚合分析，最后提取得到轨迹的时空语义模式。本发明基于城市语义图谱识别海量轨迹语义信息，克服了传统网格化轨迹模式提取的边界与粒度限制，具有时空语义模式提取数量和精度上的明显优势。CN112559587ACN112559587A权利要求书1/2页1.一种基于城市语义图谱的轨迹时空语义模式提取方法，其特征在于，具体步骤分为如下三个阶段：(一)预处理阶段：对轨迹数据进行位置与时间判定，寻找驻留点；随后对轨迹数据进行精简，只保留驻留点；(二)语义判别阶段：利用已经获得的城市语义图谱对预处理阶段得到的驻留点进行语义信息判别；按照城市语义图谱中的聚类归属进行空间频次权重的加总，最高权重类别的语义标签定义为该驻留点语义；(三)模式提取阶段：将轨迹序列看成带有语义标签的时空驻留点序列，对海量的序列进行基于标签比较的高频序列检验和时空聚合分析，最后提取得到轨迹的时空语义模式。2.根据权利要求1所述的基于城市语义图谱的轨迹时空语义模式提取方法，其特征在于，预处理阶段的具体操作流程为：对轨迹数据进行位置与时间判定，寻找在连续的30分钟时间以上的，位置变动在50m距离内的GPS点，这些点的几何中心位置定义为驻留点，认定为出行者在此地活动，到访了附近的POI点；将轨迹中所有的非驻留点删去，所有轨迹被精简成驻留点的时空迁移序列。3.根据权利要求2所述的基于城市语义图谱的轨迹时空语义模式提取方法，其特征在于，语义判别阶段利用已经获得的城市语义图谱对预处理阶段得到的驻留点进行语义信息判别；对于城市语义图谱中的每个POI点pI，其到访频次定义为：I其中，需要根据点分布提前计算出三倍标准差距离R3σ，利用所有距离p点R3σ以内的驻I留点sp累计频次，d(sp，p)指两点之间的距离；对于任意一个驻留点sp0，计算一个高斯分布系数：I来衡量驻留点和POI点之间的远近关系，则对于任意一对驻留点sp0和POI点p，计算其II空间频次权重为pop(p)×||p，sp0||；对于驻留点sp0附近的所有POI点，按照其在城市语义图谱中的聚类归属进行加总和投票，每种聚类归属类别的投票权重定义为所属POI点的空间频次权重之和，投票权重最高的类别的语义标签可以定义为该驻留点sp0的语义信息。4.根据权利要求3所述的基于城市语义图谱的轨迹时空语义模式提取方法，其特征在于，模式提取阶段，具体操作步骤为：(1)序列生成；采用PrefixSpan算法对轨迹序列的语义标签进行高频序列提取；(2)空间提取：对于高频语义标签序列模式中的每一个标签，都对应一个不少于支持度的时空驻留点集合；对于每一个驻留点集合，进行空间聚集点判断；由于这些驻留点都位于城市街区范围内，可以利用城市街道路网信息，先对其进行街区划分，位于同一个街区的驻留点组成一个子空间；在划分后的街区子空间中，计算任何一对驻留点之间的距离，如果距离小于GPS误差精度∈，则认为两点之间存在一条连接边；所有的驻留点和连接边构成图结构，利用图论算法求解图中的连通分量即子图；所有驻留点数量小于支持度的连通分量；剩余每一个连通分量的驻留点几何中心视为代表点；将这些代表点作为时空模式的空间位置2CN112559587A权利要求书2/2页数据提取出来；(3)时序提取；对于空间提取步骤中提取出的所有代表点，进行时序关联提取；序列生成步骤中的每一高频语义标签序列模式pa，假设其长度为m，即其包含的所有轨迹的长度为m，对其中所有轨迹逐一进行扫描；假设当前扫描到任一轨迹STi∈pa的第k(1≤k≤m)个点，则从空间提取步骤的结果中推导得到轨迹集合Ck，存储所

相关资料

基于城市语义图谱的轨迹时空语义模式提取方法.pdf

本发明属于轨迹计算技术领域，具体为一种基于城市语义图谱的轨迹时空语义模式提取方法。本发明包括：预处理：对轨迹数据进行位置与时间判定，对轨迹数据进行精简，只保留驻留点；语义判别：利用预处理阶段得到的驻留点进行语义信息判别；按照城市语义图谱中的聚类归属进行空间频次权重的加总，最高权重类别的语义标签定义为该驻留点语义；模式提取：将轨迹序列看成带有语义标签的时空驻留点序列，对海量的序列进行基于标签比较的高频序列检验和时空聚合分析，最后提取得到轨迹的时空语义模式。本发明基于城市语义图谱识别海量轨迹语义信息，克服了传

2023-11-10

590KB

基于轨迹数据挖掘的城市语义图谱构建方法.pdf

本发明属于轨迹计算技术领域，具体为一种基于轨迹数据挖掘的城市语义图谱构建方法。本发明包括：预处理：对轨迹数据进行位置与时间判定，寻找驻留点；聚类：根据预处理阶段处理好的驻留点对临近POI点进行到访频次计数，利用频次计数、邻域密度和语义类别对POI点进行聚类；纯化：进行聚类内部语义纯净度校验，纯净度不足的进行迭代分裂操作，直到得到多个纯净的小聚类为止；重组：对于纯化阶段产生的大量新聚类通过外部语义比较进行聚类合并。本发明高度融合并反映了人流移动聚集规律，作为一种不定构型语义信息构建技术展现了人群聚集活动在城

2023-11-09

839KB

基于语义信息的匿名轨迹隐私保护方法.pdf

本发明提供了一种基于语义信息的匿名轨迹隐私保护方法,包括:步骤1,基于空间访问密度将原轨迹数据集中的轨迹进行离散化,生成自适应离散化格网;步骤2,通过滑动窗口算法将离散化格网中的轨迹划分为若干定长的子轨迹;步骤3,分别计算滑动窗口中子轨迹的时空相似度,并分别根据子轨迹的时空相似度进行轨迹聚类,获得轨迹匿名聚类集合;步骤4,将轨迹匿名聚类集合中的同一匿名聚类中的子轨迹进行合并,合并后的子轨迹满足l?diversity。本发明可使发布的匿名轨迹数据集有效抵御去匿名攻击和语义攻击,保护用户隐私,减少数据损失,保

2023-05-23

738KB

基于主从框架模式的语义成分解析方法.pdf

本发明公开了一种基于主从框架模式的语义成分解析方法，其包括步骤：通过训练语料得到基本表达模式、实体修饰模式、谓语修饰模式及辅助判断材料；将基本表达模式、实体修饰模式、谓语修饰模式索引到Trie树；利用基本表达模式树、谓语修饰模式树以及实体修饰模式树对语句进行解析得到候选层次语义成分树；对所述候选语义成分树进行排序并得到所述语句的最优语义成分树。本发明解决了目前语义分析需要大量样本标注及过度依赖句法分析效果的问题。

2023-07-21

743KB

基于车辆语义轨迹数据的停留点分析方法及其系统.pdf

本发明提供一种基于车辆语义轨迹数据的停留点分析方法及其系统，方法包括：获取车辆在预设时长内的轨迹数据；依据所述轨迹数据获取可疑停留点集合；对所述可疑停留点集合做聚类分析，得到至少一个的聚类点集合；基于语义分析每个聚类点集合，获取对应一预设关键词的聚类中心。本发明基于车辆预设历史时间内的轨迹数据进行分析处理，先获取可疑停留点集合，再据此做聚类分析，在聚类结果中根据实际业务需求做基于语义的聚类中心锁定，获取所有聚类中心作为最终停留点结果。能够为后续实际应用提供决策信息，满足现实业务需求。

2023-11-17

699KB