预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107391564A(43)申请公布日2017.11.24(21)申请号201710441516.3(22)申请日2017.06.13(71)申请人阿里巴巴集团控股有限公司地址英属开曼群岛大开曼资本大厦一座四层847号邮箱(72)发明人席炎王文雯杜玮赵星(74)专利代理机构北京晋德允升知识产权代理有限公司11623代理人周莉娜(51)Int.Cl.G06F17/30(2006.01)G06F21/62(2013.01)权利要求书4页说明书13页附图3页(54)发明名称数据转换方法、装置以及电子设备(57)摘要本申请公开了数据转换方法、装置以及电子设备。所述方法包括:接收各原始数据,以及在接收过程中多次对已接收到的原始数据进行集合划分;根据在各次集合划分得到的原始数据集合中的原始数据分布变化情况,确定最终的集合划分参数;对采用所述最终的集合划分参数划分得到的原始数据集合进行脱敏转换处理,得到脱敏数据。利用本申请实施例,可以对数据拥有者提供的原始数据进行脱敏转换处理,同时一定程度上可以保留原始数据的分布特征,再将得到的脱敏数据提供给数据存储平台,从而有利于降低数据拥有者的隐私通过数据存储平台泄露的风险,则有利于数据的共享利用。CN107391564ACN107391564A权利要求书1/4页1.一种数据转换方法,包括:接收各原始数据,以及在接收过程中多次对已接收到的原始数据进行集合划分;根据在各次集合划分得到的原始数据集合中的原始数据分布变化情况,确定最终的集合划分参数;对采用所述最终的集合划分参数划分得到的原始数据集合进行脱敏转换处理,得到脱敏数据。2.如权利要求1所述的方法,所述在接收过程中多次对已接收到的原始数据进行集合划分,具体包括:在接收过程中,每当接收到设定数量的原始数据时,对已接收到的全部原始数据进行一次集合划分。3.如权利要求2所述的方法,所述根据在各次集合划分得到的原始数据集合中的原始数据分布变化情况,确定最终的集合划分参数,具体包括:将每次集合划分及其前一次集合划分得到的原始数据集合进行对比,和/或将每次集合划分及其前一次集合划分采用的集合划分参数进行对比;根据对比结果,确定原始数据集合中的原始数据分布变化情况;当原始数据分布变化程度小于指定阈值时,将当次集合划分或者其前一次集合划分时采用的集合划分参数确定为最终的集合划分参数。4.如权利要求3所述的方法,所述将每次集合划分得到的原始数据集合与前一次集合划分得到的原始数据集合进行对比,具体包括:分别计算每次集合划分及其前一次集合划分得到的各原始数据集合中的数据在对应的已接收到的原始数据中的占比;将分别计算出的占比进行对比。5.如权利要求1所述的方法,当所述原始数据均为数值型数据时,所述对已接收到的原始数据进行集合划分,具体包括:采用等距划分的方式对已接收到的原始数据进行集合划分;或者,采用等频划分的方式对已接收到的原始数据进行集合划分。6.如权利要求5所述的方法,所述采用等距划分的方式对已接收到的原始数据进行集合划分,具体包括:确定一个待划分数值区间;将所述待划分数值区间划分为多个等长的数值子区间;分别将每个所述数值子区间包含的已接收到的原始数据划分为一个原始数据集合。7.如权利要求5所述的方法,所述采用等频划分的方式对已接收到的原始数据进行集合划分,具体包括:对已接收到的原始数据进行排序;根据排序结果,将所述已接收到的原始数据划分为多个原始数据集合,每个所述原始数据集合中包含的原始数据数量相同。8.如权利要求1所述的方法,当所述原始数据均为非数值型数据时,所述对已接收到的原始数据进行集合划分,具体包括:在已接收到的原始数据中分别确定不同的非数值型数据分别的占比;2CN107391564A权利要求书2/4页将占比小于设定比例的全部非数值型数据划分为一个原始数据集合,以及将占比不小于所述设定比例的不同的非数值型数据划分为一个或者多个原始数据集合。9.如权利要求1所述的方法,所述在接收过程中多次对已接收到的原始数据进行集合划分,具体包括:在接收过程中,每当接收到设定数量的原始数据时,将已接收到的全部原始数据划分为一个原始数据集合。10.如权利要求9所述的方法,所述根据在各次集合划分得到的原始数据集合中的原始数据分布变化情况,确定最终的集合划分参数,具体包括:确定每次集合划分得到的原始数据集合相比于其前一次集合划分得到的原始数据集合,新增且不与之前重复的原始数据的占比;当所述占比小于设定阈值时,根据当次集合划分得到的原始数据集合,确定最终的集合划分参数。11.如权利要求10所述的方法,所述根据当次集合划分得到的原始数据集合,确定最终的集合划分参数,具体包括:将设定比例,以及所述当次集合划分得