预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109711194A(43)申请公布日2019.05.03(21)申请号201811593243.5(22)申请日2018.12.25(71)申请人北京天融信网络安全技术有限公司地址100085北京市海淀区上地东路1号院3号楼四层申请人北京天融信科技有限公司北京天融信软件有限公司(72)发明人宋鹏举郭丹阳王圣光张倩瑜(74)专利代理机构北京金信知识产权代理有限公司11225代理人喻嵘郭迎侠(51)Int.Cl.G06F21/62(2013.01)权利要求书2页说明书6页附图1页(54)发明名称一种数据处理方法及数据处理装置(57)摘要本申请实施例提供了一种数据处理方法及数据处理装置,所述方法包括:从数值型数据集合中逐一获取数值型数据;利用二项分布根据设定概率确定当前获取的数值型数据的二项值;根据所述二项值,确定所述当前获取的数值型数据的脱敏方式,并以所述脱敏方式对所述当前获取的数值型数据进行脱敏处理,其中,所述脱敏方式能够保持所述数值型数据的统计特征。通过上述方法完成对数值型数据集合中的数值型数据的脱敏处理后,使得进行了脱敏处理后的脱敏数据能够保留有原始的数值型数据的统计特定,并且能够降低原始的数值型数据泄露的安全风险,提高了脱敏数据的使用价值。CN109711194ACN109711194A权利要求书1/2页1.一种数据处理方法,其特征在于,包括:从数值型数据集合中逐一获取数值型数据;利用二项分布根据设定概率确定当前获取的数值型数据的二项值;根据所述二项值,确定所述当前获取的数值型数据的脱敏方式,并以所述脱敏方式对所述当前获取的数值型数据进行脱敏处理,其中,所述脱敏方式能够保持所述数值型数据的统计特征。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述二项值,确定所述当前获取的数值型数据的脱敏方式,并以所述脱敏方式对所述当前获取的数值型数据进行脱敏处理,包括:若所述二项值为第一值,则将所述当前获取的数值型数据以所述数值型数据集合中任一个未被获取的数值型数据进行替换,形成第一脱敏数据,并将所述当前获取的数值型数据作为第二脱敏数据。3.根据权利要求2所述的数据处理方法,其特征在于,所述方法还包括:基于所述数值型数据集合中的各个数值型数据,构建高斯分布,其中,所述高斯分布的位置参数为零,分布参数为所述数值型数据的标准差。4.根据权利要求3所述的数据处理方法,其特征在于,所述根据所述二项值,确定所述当前获取的数值型数据的脱敏方式,并以所述脱敏方式对所述当前获取的数值型数据进行脱敏处理,还包括:若所述二项值为第二值,则通过所述高斯分布确定所述当前获取的数值型数据对应的第一随机值,并根据所述第一随机值,生成所述当前获取数值型数据的第三脱敏数据。5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述二项值,确定所述当前获取的数值型数据的脱敏方式,并以所述脱敏方式对所述当前获取的数值型数据进行脱敏处理,还包括:若所述二项值为第一值,且所述数值型数据集合中的数值型数据均被获取时,则将所述当前获取的数值型数据作为第四脱敏数据。6.一种数据处理装置,其特征在于,包括:获取模块,其用于从数值型数据集合中逐一获取数值型数据;第一处理模块,其用于利用二项分布根据设定概率确定当前获取的数值型数据的二项值;第二处理模块,其用于根据所述二项值,确定所述当前获取的数值型数据的脱敏方式,并以所述脱敏方式对所述当前获取的数值型数据进行脱敏处理,其中,所述脱敏方式能够保持所述数值型数据的统计特征。7.根据权利要求6所述的数据处理装置,其特征在于,所述第二处理模块具体用于:若所述二项值为第一值,则将所述当前获取的数值型数据以所述数值型数据集合中任一个未被获取的数值型数据进行替换,以形成第一脱敏数据,并将所述当前获取的数值型数据作为第二脱敏数据。8.根据权利要求7所述的数据处理装置,其特征在于,所述装置还包括:构建模块,其用于基于所述数值型数据集合中的各个数值型数据,构建高斯分布,其中,所述高斯分布的位置参数为零,分布参数为所述数值型数据的标准差。2CN109711194A权利要求书2/2页9.根据权利要求8所述的数据处理装置,其特征在于,所述第二处理模块还用于:若所述二项值为第二值,则通过所述高斯分布确定所述当前获取的数值型数据对应的第一随机值,并根据所述第一随机值,通过生成模块生成所述当前获取数值型数据的第三脱敏数据。10.根据权利要求9所述的数据处理装置,其特征在于,所述第二处理模块还用于:若所述二项值为第一值,且所述数值型数据集合中的数值型数据均被获取时,则将所述当前获取的数值型数据作为第四脱敏数据。3CN109711194A说明书1/6页一种数据处理方法及数据处理