预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112765226A(43)申请公布日2021.05.07(21)申请号202011418901.4(22)申请日2020.12.06(71)申请人复旦大学地址200433上海市杨浦区邯郸路220号(72)发明人孙未未单张卿(74)专利代理机构上海正旦专利代理有限公司31200代理人陆飞陆尤(51)Int.Cl.G06F16/2458(2019.01)G06F16/29(2019.01)G06F16/36(2019.01)权利要求书2页说明书5页附图2页(54)发明名称基于轨迹数据挖掘的城市语义图谱构建方法(57)摘要本发明属于轨迹计算技术领域,具体为一种基于轨迹数据挖掘的城市语义图谱构建方法。本发明包括:预处理:对轨迹数据进行位置与时间判定,寻找驻留点;聚类:根据预处理阶段处理好的驻留点对临近POI点进行到访频次计数,利用频次计数、邻域密度和语义类别对POI点进行聚类;纯化:进行聚类内部语义纯净度校验,纯净度不足的进行迭代分裂操作,直到得到多个纯净的小聚类为止;重组:对于纯化阶段产生的大量新聚类通过外部语义比较进行聚类合并。本发明高度融合并反映了人流移动聚集规律,作为一种不定构型语义信息构建技术展现了人群聚集活动在城市范围内的行为复杂性与空间规律性,在实际应用中具有空间粒度细且语义数量多的巨大优势。CN112765226ACN112765226A权利要求书1/2页1.一种基于轨迹数据挖掘的城市语义图谱构建方法,其特征在于,是通过轨迹数据挖掘将语义兴趣点(简称POI)数据进行转化,具体步骤分为如下四个阶段:(一)预处理阶段:对轨迹数据进行位置与时间判定,寻找驻留点;随后对轨迹数据进行精简,只保留驻留点;(二)聚类阶段:根据预处理阶段处理好的驻留点对临近POI点进行到访频次计数,利用频次计数、邻域密度和语义类别对POI点进行基于密度的带额外判定条件的DBScan聚类(三)纯化阶段,根据聚类阶段得到的大量聚类进行内部语义纯净度校验;对于纯净度不足的,进行迭代的二分裂操作,直到得到多个纯净的小聚类为止;(四)重组阶段,对于纯化阶段产生的大量新聚类通过外部语义比较进行聚类合并。2.根据权利要求1所述的基于轨迹数据挖掘的城市语义图谱构建方法,其特征在于,预处理阶段的具体做法为,对轨迹数据进行位置与时间判定,寻找在连续的30分钟时间以上的,位置变动在50m距离内的GPS点,这些点的几何中心位置定义为驻留点(staypoint),认定为出行者在此地活动,到访了附近的POI点。3.根据权利要求1所述的基于轨迹数据挖掘的城市语义图谱构建方法,其特征在于,聚类阶段的具体步骤为:步骤(1),利用驻留点位置,对附近每个POI点做到访频次计数;对于每个POI点pI,其到访频次定义为:即根据GPS的分布误差符合二维高斯分布的特点,定义三倍标准差距离R3σ,利用所有距II离p点R3σ以内的驻留点sp累计频次,d(sp,p)指两点之间的距离;频次采用高斯分布系数进行描述,符合越近到访概率越大的客观规律;步骤(2),利用POI点的频次计数、邻域密度和语义类别对POI点进行密度聚类;采用DBScan聚类算法为基础稍作改进,对所有POI点进行聚类,即在DBScan聚类算法的扩充聚类阶段加入若干判定条件,当判定条件为真时,才允许执行加入新点到当前聚类集合;该条件定义如下:对于当前聚类集合的代表元pI,其临近的点在聚类算法中需要满足额外条件:其中,和pI.s指POI点的语义类别标签属性,α指到访频次相似系数取值区间(0,1),dv指投影重叠距离;该额外条件的含义为在两个相临近的POI点,如果在到访频次接近的前提下,语义标签属性相同或者其距离接近到近乎上下重叠则认为二者属于同一个聚类集合。4.根据权利要求3所述的基于轨迹数据挖掘的城市语义图谱构建方法,其特征在于,纯化阶段,对于每个聚类而言,执行以下步骤:步骤(1)、校验;对于该聚类C0,对内部每个POI点进行语义类别校验和空间分布校验,只要通过任意一项,即认为是纯净聚类,直接结束无需执行后续步骤;其中:语义类别校验指即聚类内部所有点语义类别一致;空间分布校验指即聚类的内部两点之间最大距离小于2CN112765226A权利要求书2/2页直径阈值dc;步骤(2)、描述;对于无法通过校验步骤的聚类,对内部每个点的语义类别分布概率进行描述,该概率分布代表每个聚类内部每个POI点局部位置的语义类别组成占比;对于任意点其内部语义类别分布概率定义为:即每一种语义类别占比被定义为该类别其余点到该点的到访频次计数在所有类别的计数总和中的占比;步骤(3)、分裂;选择聚类内部最邻近几何中心的POI点作为代表点,比较其他点和代表点语义类别分布概率之间的差值距离,差值