预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111539009A(43)申请公布日2020.08.14(21)申请号202010502525.0(22)申请日2020.06.05(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人李漓春张文彬(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06F21/60(2013.01)G06F21/62(2013.01)G06N20/00(2019.01)权利要求书5页说明书23页附图4页(54)发明名称保护隐私数据的有监督特征分箱方法及装置(57)摘要本说明书实施例提供了一种保护隐私数据的有监督特征分箱方法及装置。标签持有方将通过同态加密后的N个第一加密标签值发送至特征持有方;特征持有方,按照既定顺序,将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列,通过变换随机数将对应的第一加密标签值变换为第二加密标签值,并得到按照更新顺序排列的N个第二加密标签值构成的第二序列,至少将第二序列发送至标签持有方;标签持有方至少基于第二序列进行特征分箱,得到第一分箱结果,并发送至特征持有方;特征持有方再根据第一分箱结果对N个特征值进行分箱。CN111539009ACN111539009A权利要求书1/5页1.一种保护隐私数据的有监督特征分箱方法,通过特征持有方执行,所述特征持有方存储有N个样本的第一特征的特征值,所述N个样本的原始标签值存储在标签持有方中,所述原始标签值的取值包括0和1,所述N个样本按照既定顺序排列;所述方法包括:获取所述标签持有方发送的按照所述既定顺序排列的N个第一加密标签值,每个第一加密标签值是使用公钥对对应的原始标签值同态加密后得到;基于所述既定顺序,将所述N个第一加密标签值分别与所述第一特征的N个特征值进行关联,得到关联关系;对所述N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列;对于各个第一加密标签值,将其与对应的变换随机数同态相乘,得到对应的第二加密标签值;基于所述关联关系和所述第一序列,确定按照所述更新顺序排列的N个第二加密标签值构成的第二序列;至少将所述第二序列发送至所述标签持有方,以使所述标签持有方至少基于所述第二序列进行特征分箱,得到第一分箱结果;接收所述标签持有方发送的所述第一分箱结果,其中示出所述更新顺序中各个位置所对应的第一分箱;按照所述第一分箱结果,对所述第一序列中各个位置的特征值进行分箱,得到特征分箱结果。2.根据权利要求1所述的方法,在所述对于各个第一加密标签值,将其与对应的变换随机数同态相乘的步骤之前,还包括:对于各个第一加密标签值,确定对应的非0随机数,基于所述非0随机数确定变换随机数。3.根据权利要求1所述的方法,在所述N个特征值中不存在相等特征值的情况下,所述至少将所述第二序列发送至所述标签持有方的步骤,包括:直接将所述第二序列发送至所述标签持有方。4.根据权利要求1所述的方法,在所述N个特征值中存在相等特征值的情况下,所述至少将所述第二序列发送至所述标签持有方的步骤,包括:基于所述第一序列中的N个特征值,确定所述更新顺序中相等特征值所在位置,将所述第二序列以及所述更新顺序中相等特征值所在位置发送至所述标签持有方。5.根据权利要求1所述的方法,所述按照所述第一分箱结果,对所述第一序列中各个位置的特征值进行分箱的步骤,包括:将所述第一分箱结果中的各个位置分别与所述第一序列中的各个位置进行对应,将所述第一分箱结果中每个位置的第一分箱确定为所述第一序列中对应位置的特征值的分箱。6.根据权利要求1所述的方法,所述更新顺序中相等特征值所在位置采用以下方式中的一种表示:所述更新顺序中位置之间存在预设间隔符,用于标记相同特征值所在位置;所述更新顺序中的各个位置采用一维位图表示,各个位置中相等特征值位置采用所述一维位图中的指定数值分布规则区分。7.一种保护隐私数据的有监督特征分箱方法,通过标签持有方执行,所述标签持有方2CN111539009A权利要求书2/5页存储有N个样本的原始标签值,所述N个样本中的第一特征的特征值存储在特征持有方中,所述原始标签值的取值包括0和1,所述N个样本按照既定顺序排列;所述方法包括:使用公钥将N个原始标签值同态加密为对应的第一加密标签值,并将按照所述既定顺序排列的N个第一加密标签值发送至所述特征持有方;接收所述特征持有方至少发送的第二序列;所述第二序列由按照更新顺序排列的N个第二加密标签值组成;使用与所述公钥对应的私钥,对所述第二序列中的每个第二加密标签值进行解密,当解