预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113761000A(43)申请公布日2021.12.07(21)申请号202010506698.X(22)申请日2020.06.05(71)申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼(72)发明人李梓安江健宇齐冀苏子超崔鹤鸣王森王鹏张弓(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人颜晶(51)Int.Cl.G06F16/2457(2019.01)G06F21/62(2013.01)G16H10/60(2018.01)权利要求书3页说明书15页附图8页(54)发明名称数据处理的方法、装置、计算设备和存储介质(57)摘要本申请提供了一种数据处理的方法、装置、计算设备和存储介质,属于大数据技术领域。该方法包括:根据查询算法,确定输入数据集对应的第一查询输出,根据输入数据集中未被抽样的数据记录的第二查询输出和查询算法,确定输入数据集中被抽样的目标数目条数据记录中每条数据记录对第一查询输出的扰动,获得输入数据集对应的敏感度,未被抽样的数据记录与目标数目条数据记录组成输入数据集,根据敏感度,对第一查询输出加噪声,输出加噪声后的第一查询输出。采用本申请,可以减少敏感度的计算量,提升数据处理的效率。CN113761000ACN113761000A权利要求书1/3页1.一种数据处理的方法,其特征在于,所述方法包括:根据查询算法,确定输入数据集对应的第一查询输出;根据所述输入数据集中未被抽样的数据记录的第二查询输出和所述查询算法,确定所述输入数据集中被抽样的目标数目条数据记录中每条数据记录对所述第一查询输出的扰动,获得所述输入数据集对应的敏感度,所述未被抽样的数据记录与所述目标数目条数据记录组成所述输入数据集;根据所述敏感度,对所述第一查询输出加噪声,输出加噪声后的第一查询输出。2.根据权利要求1所述的方法,其特征在于,所述根据查询算法,确定输入数据集对应的第一查询输出之前,还包括:接收数据查询请求,所述数据查询请求包括查询算法;在所述数据查询请求对应的所述输入数据集中随机抽样目标数目条数据记录,获得所述目标数目条数据记录以及所述输入数据集中未被抽样的数据记录。3.根据权利要求1或2所述的方法,其特征在于,所述根据查询算法,确定输入数据集对应的第一查询输出,包括:根据所述查询算法,确定所述未被抽样的数据记录对应的第二查询输出和所述目标数目条数据记录对应的第三查询输出;根据所述第二查询输出和所述第三查询输出,确定所述输入数据集对应的第一查询输出。4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述输入数据集中未被抽样的数据记录的第二查询输出和所述查询算法,确定所述输入数据集中被抽样的目标数目条数据记录中每条数据记录对所述第一查询输出的扰动,获得所述输入数据集对应的敏感度,包括:根据所述查询算法,确定所述目标数目条数据记录对应的第三查询输出;根据所述查询算法,确定所述目标数目条数据记录中分别删除每条数据记录后的查询输出;根据所述未被抽样的数据记录的第二查询输出、所述第三查询输出和所述目标数目条数据记录中分别删除每条数据记录后的查询输出,确定所述目标数目条数据记录中每条数据记录对所述第一查询输出的扰动;将所述目标数目条数据记录对所述第一查询输出的扰动中的最大扰动,确定为所述输入数据集对应的敏感度。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述敏感度,对所述第一查询输出加噪声,输出加噪声后的第一查询输出之前,还包括:将所述输入数据集,按照数据记录所属的分区,分为至少两个分区;根据所述查询算法,确定所述至少两个分区的当前查询输出;确定所述至少两个分区中的每个分区的当前查询输出与历史查询输出不相同。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:对于所述至少两个分区中的目标分区,若所述目标分区的当前查询输出与所述目标分区的历史查询输出相同,则在所述目标分区中删除至少一条数据记录,使得所述至少两个分区中每个分区的当前查询输出与历史查询输出不相同;2CN113761000A权利要求书2/3页根据所述查询算法,确定所述目标分区删除所述至少一条数据记录后的查询输出;根据所述目标分区删除所述至少一条数据记录后的查询输出,确定所述输入数据集的第四查询输出;根据所述敏感度,对所述第四查询输出加噪声,输出加噪声后的第四查询输出。7.一种数据处理的装置,其特征在于,所述装置包括:确定模块,用于:根据查询算法,确定输入数据集对应的第一查询输出;根据所述输入数据集中未被抽样的数据记录的第二查询输出和所述查询算法,确定所述输入数据集中被抽样的目标数目条数据记录中每条数据记录对所述第一查询输出的扰动,获得所述