预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113849471A(43)申请公布日2021.12.28(21)申请号202111139422.3(22)申请日2021.09.26(71)申请人中国联合网络通信集团有限公司地址100033北京市西城区金融大街21号(72)发明人章国政乔柏常红珍(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人杨泽刘芳(51)Int.Cl.G06F16/174(2019.01)G06K9/62(2006.01)G06F21/60(2013.01)权利要求书2页说明书13页附图4页(54)发明名称数据压缩方法、装置、设备及存储介质(57)摘要本申请提供一种数据压缩方法、装置、设备及存储介质,该方法获取用户轨迹,对用户轨迹进行聚类处理,得到K个用户聚类,并确定每个用户聚类对应的压缩阈值,其中,每个用户聚类中包括一个或多个用户轨迹,其中,K为任意正整数;根据预设总隐私预算、用户聚类中的用户轨迹数量和用户轨迹总数量,确定每个用户聚类对应的隐私预算;针对每个用户轨迹,根据用户轨迹的待压缩点、起始轨迹点和终止轨迹点,确定用户轨迹对应的压缩阈值;根据压缩阈值,通过矢量数据压缩算法,对每个用户轨迹进行压缩处理,得到每个用户轨迹对应的近似路径;根据隐私预算,为每个近似路径添加噪声扰动,得到用户轨迹的目标压缩数据。CN113849471ACN113849471A权利要求书1/2页1.一种数据压缩方法,其特征在于,包括:获取用户轨迹,对所述用户轨迹进行聚类处理,得到K个用户聚类,并确定每个所述用户聚类对应的压缩阈值,其中,每个所述用户聚类中包括一个或多个用户轨迹,其中,K为任意正整数;根据预设总隐私预算、用户聚类中的用户轨迹数量和用户轨迹总数量,确定每个所述用户聚类对应的隐私预算;针对每个用户轨迹,根据所述用户轨迹的待压缩点、起始轨迹点和终止轨迹点,确定所述用户轨迹对应的压缩阈值;根据压缩阈值,通过矢量数据压缩算法,对所述每个用户轨迹进行压缩处理,得到每个所述用户轨迹对应的近似路径;根据所述隐私预算,为每个所述近似路径添加噪声扰动,得到用户轨迹的目标压缩数据。2.根据权利要求1所述的方法,其特征在于,所述对所述用户轨迹进行聚类处理,得到K个用户聚类,包括:随机初始化聚类个数和每个聚类对应的中心点;计算每个所述用户轨迹到所有中心点的欧式距离,并按照距离最近的准则将所述用户轨迹进行聚类划分,将每个划分后的聚类中所有用户轨迹的均值确定为所述聚类的更新中心点,重复执行随机初始化聚类个数和每个聚类对应的中心点的步骤直至预设迭代次数。3.根据权利要求1所述的方法,其特征在于,所述针对每个用户轨迹,根据所述用户轨迹的待压缩点、起始轨迹点和终止轨迹点,确定所述用户轨迹对应的压缩阈值,包括:针对每个用户轨迹,计算所有待压缩点到起始轨迹点和终止轨迹点的直线的垂直欧式距离的平均值,将所述平均至确定为所述用户轨迹对应的压缩阈值。4.根据权利要求1所述的方法,其特征在于,所述根据预设总隐私预算、用户聚类中的用户轨迹数量和用户轨迹总数量,确定每个所述用户聚类对应的隐私预算,包括:确定用户聚类中的用户轨迹数量和所述用户轨迹总数量的比值;将所述比值与预设总隐私预算的乘积确定为所述用户聚类对应的隐私预算。5.根据权利要求1所述的方法,其特征在于,所述根据压缩阈值,通过矢量数据压缩算法,对所述每个用户轨迹进行压缩处理,得到每个所述用户轨迹对应的近似路径,包括:针对每个用户轨迹,将所述用户轨迹的首尾两点连接,得到用户轨迹弦;遍历所述用户轨迹上的所有待压缩轨迹点,并确定所述待压缩轨迹点到所述用户轨迹弦的垂直欧式距离的最大值,获取在所述用户轨迹弦上的最大值点;比较所述垂直欧式距离的最大值与所述用户轨迹对应的压缩阈值的大小,根据比较结果确定所述用户轨迹对应的近似路径。6.根据权利要求5所述的方法,其特征在于,所述比较所述垂直欧式距离的最大值与所述用户轨迹对应的压缩阈值的大小,根据比较结果确定所述用户轨迹对应的近似路径,包括:若所述垂直欧式距离的最大值小于或等于压缩阈值,则确定所述用户轨迹弦为所述用户轨迹对应的近似路径。7.根据权利要求5所述的方法,其特征在于,所述比较所述垂直欧式距离的最大值与压2CN113849471A权利要求书2/2页缩阈值的大小,根据比较结果确定所述用户轨迹对应的近似路径,包括:若所述垂直欧式距离的最大值大于压缩阈值,则根据所述最大值点将所述用户轨迹弦进行分段处理,得到分段用户轨迹弦;针对每段分段用户轨迹弦,将所述分段用户轨迹弦的首尾两点连接,得到分段用户轨迹弦;遍历所述分段用户轨迹上的所有待压缩轨迹点,并确定所述待压缩轨迹点到所述分段用户轨迹弦的垂直欧式距离的最大值,获取在所述分段用户轨