预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111984841A(43)申请公布日2020.11.24(21)申请号202010571744.4(22)申请日2020.06.22(71)申请人上海骥灏网络股份有限公司地址200942上海市宝山区蕴川路5475号3905室(72)发明人贾新志(51)Int.Cl.G06F16/906(2019.01)G06F16/36(2019.01)G06F16/29(2019.01)权利要求书3页说明书6页附图1页(54)发明名称一种基于用户行为的画像算法(57)摘要本发明公开了一种基于用户行为的画像算法,通过分析目标对象的移动轨迹信息,使用一种再聚类的方法挖掘用户移动轨迹停留点、停留区域以及停留时长。对多噪且密集的移动点进行系统采样,再通过采样后的移动点计算相邻停留区域之间的转移平均速度和转移速度的波动指数,进而分析用户转移的交通方式。另外,基于停留点的挖取,以天为周期,采用类Apriori算法挖掘用户频繁周期模式,应用高德地图API对用户轨迹的频繁周期模式中出现的地理区域进行语义相关,最终实现了用户生活模式和转移交通方式的分析与可视化表达。CN111984841ACN111984841A权利要求书1/3页1.一种基于用户行为的画像算法,其特征在于,包括以下步骤:步骤1:对目标每天的移动轨迹数据按空间距离和时间跨度进行聚类,分别挖掘出停留点和移动点;步骤2:对步骤1中得到的每类停留点,求平均坐标,得到以平均坐标为中心的停留区域;步骤3:对聚类得到的每两个相邻停留区域之间的移动点进行系统采样;步骤4:根据采样点逐点计算目标对象每两个停留区域之间的移动距离,移动距离与起始移动点的时间差的比值,即为两个相邻停留区域之间的转移平均速度;步骤5:根据步骤3中的采样点计算两个停留区域之间的转移速度的波动指数;步骤6:对步骤2得到的每天的停留区域,以天为周期,采用类apriori算法挖掘目标对象的周期频繁停留区域;步骤7:对步骤6挖掘的周期频繁停留区域进行语义相关;步骤8:构造目标对象移动轨迹语义信息表,画出移动轨迹模式图;步骤9:结合步骤8中的图、表,分析目标对象某一天的生活模式、转移交通方式以及某一段时间内的周期生活模式和活动区域范围。2.根据权利要求1所述的一种基于用户行为的画像算法,其特征在于,步骤1的具体实现过程是:将用户一天的轨迹用一个以时间为顺序的时空坐标序列T={pm=(xm,ym,tm)|m=1,2…N}表示,其中,xm表示该点的经度坐标,ym表示该点的纬度坐标,tm表示记录该点的时刻,m表示第m个点,N表示该用户某一天轨迹点的总数;假设每个点pm都是停留点,若对于任意点pi到pj的子序列{pi…pj}中的点与pi的距离都小于预设值M米,且pi与pj的时间差大于预设值L分钟,则{pi…pj}组成的区域即是一个以pi为中心、半径为M米的停留区域,不属于任何停留区域的点被定义为移动点;对中间无移动点的相邻停留区域,采取再聚类策略,即把两个中心距离小于M米的停留区域合并为一个停留区域。3.根据权利要求1所述的一种基于用户行为的画像算法,其特征在于,步骤2中所述平均坐标的计算,采用如下方法:将平均坐标定义为一个二维空间点的经、纬度坐标:其中,xi,yi分别表示轨迹点pi的经度和纬度,nk表示第k个停留区域停留点的数量。4.根据权利要求1所述的一种基于用户行为的画像算法,步骤4中所述相邻停留区域之间的转移平均速度的计算,采用如下方法:相邻停留区域R1到R2的转移距离定义为所有相邻移动点之间的距离累加的和,平均转移速度定义为R1到R2的转移距离的平均速度,计算公式为:2CN111984841A权利要求书2/3页其中,pi表示相邻停留区域R1到R2之间的移动点,dis(pi,pi+1)表示相邻移动点pi与pi+1的实际地理距离,Δt表示R1到R2的转移时间,是起始移动点的时间差值。5.根据权利要求4所述的一种基于用户行为的画像算法,其特征在于,步骤5中所述转移速度的波动指数的计算,采用如下方法:相邻停留区域R1到R2的转移速度的波动指数被定义为转移速度的均方差计算公式为:其中,vi,i+1表示相邻点pi、pi+1之间的平均速度,m表示相邻停留区域R1到R2之间移动点的个数,ti表示pi点的时间值。6.根据权利要求1所述的一种基于用户行为的画像算法,其特征在于,步骤6中,采用类apriori算法,设置以一天为周期,最小支持度为min_support,两个中心距离小于预定值M米的停留区域视为同一停留区域。7.根据权利要求1所述的一种基于用户行为的画像算法,其特征在于,步骤7中,通过调用高德地图开放平台的API,对每个停留区域的平均坐标进行反地理编码,得到相应坐标的实际地