预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115730346A(43)申请公布日2023.03.03(21)申请号202211434435.8(22)申请日2022.11.16(71)申请人华润数字科技有限公司地址518000广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园2栋801(72)发明人宁景文钟焰涛郑毅(74)专利代理机构广州嘉权专利商标事务所有限公司44205专利代理师周翀(51)Int.Cl.G06F21/62(2013.01)G06F21/60(2023.01)G06Q30/0202(2019.01)G06N20/20(2013.01)权利要求书2页说明书7页附图5页(54)发明名称基于纵向联邦学习的隐私数据处理方法、电子设备及介质(57)摘要本发明涉及数据加密处理领域,公开了一种基于纵向联邦学习的隐私数据处理方法、电子设备及介质,从方差角度降低泛化误差。通过加密处理发起方用于表征商户购买行为的第一数据集和数据提供方用于表征消费者在商户处的消费行为的第二数据集并进行求交处理,得到交叉数据集,发起方随机采样交叉数据集并进行加密操作,提高了商户隐私数据的安全性;并记录被抽中的样本唯一标识并发给数据提供方,保证数据提供方的数据和发起方的数据一致性,发起方和数据提供方根据自身特征进行分箱操作得到最佳预测值,该预测值能够准确反馈商户的购买意愿行为。对最佳预测值求期望值或求众数,进一步降低方差,提高对商户购买意愿行为预测的精准度。CN115730346ACN115730346A权利要求书1/2页1.一种基于纵向联邦学习的隐私数据处理方法,其特征在于,包括:发起方获取用于表征商户购买行为的第一数据集和数据提供方获取用于表征消费者在商户处的消费行为的第二数据集,所述发起方和所述数据提供方分别加密处理所述第一数据集和所述第二数据集,得到第一加密数据集和第二加密数据集;所述发起方和所述数据提供方求交处理所述第一加密数据集和所述第二加密数据集,得到交叉数据集;所述发起方随机采样所述交叉数据集,得到发起方采样集,并记录所述发起方采样集中被抽中的样本唯一标识;所述发起方对所述发起方采样集进行加密操作,得到加密发起方采样集,并将所述加密发起方采样集发送给所述数据提供方;所述发起方和所述数据提供方分别根据自身特征进行分箱操作,得到发起方分位点和数据提供方分位点;所述发起方对所述加密发起方采样集进行解密操作,并根据所述发起方的特征、所述数据提供方的特征、所述发起方分位点和所述数据提供方分位点计算信息增益,得到信息增益值;所述发起方根据所述信息增益值,得到最佳特征和最佳分裂点;所述发起方根据所述最佳特征和所述最佳分裂点,得到所述采样集的最佳预测值,所述最佳预测值用于反馈商户购买意愿行为。2.根据权利要求1所述的基于纵向联邦学习的隐私数据处理方法,其特征在于,所述发起方获取用于表征商户购买行为的第一数据集和数据提供方获取用于表征消费者在商户处的消费行为的第二数据集,包括:所述发起方和所述数据提供方分别对所述第一数据集和所述第二数据集进行哈希算法计算,得到第一哈希数据集和第二哈希数据集;所述发起方生成公钥和私钥,并将所述公钥发送给所述数据提供方,所述发起方利用所述私钥和所述第一哈希数据集进行二次哈希算法计算,得到第一加密数据集;所述数据提供方利用所述公钥加密,得到所述数据提供方的加密数据集,对所述数据提供方的加密数据集进行二次哈希算法计算,得到第二加密数据集。3.根据权利要求2所述的基于纵向联邦学习的隐私数据处理方法,其特征在于,所述数据提供方利用所述公钥加密,得到所述数据提供方的加密数据集,包括:所述数据提供方生成随机数,对要对齐的数据集进行公钥加密处理,并用所述随机数对所述要对齐的数据进行加盲,得到加盲数据集;所述发起方获取所述加盲数据集后用所述私钥进行签名,并将签名结果发送给所述数据提供方;所述数据提供方对所述签名结果进行去盲处理,得到加密数据集。4.根据权利要求1所述的基于纵向联邦学习的隐私数据处理方法,其特征在于,所述发起方随机采样所述交叉数据集,得到发起方采样集,并记录所述发起方采样集中被抽中的样本唯一标识之后,还包括:所述数据发起方获取所述样本唯一标识,并根据所述样本唯一标识得到所述数据提供方采样集,所述数据提供方采样集和所述发起方采样集相同。2CN115730346A权利要求书2/2页5.根据权利要求1所述的基于纵向联邦学习的隐私数据处理方法,其特征在于,所述发起方对所述发起方采样集进行加密操作,得到加密发起方采样集,包括:所述发起方根据预设的损失函数及标签值对所述发起方采样集进行一阶求导和二阶求导,得到一阶导数和二阶导数,并对所述一阶导数和所述二阶导数进行加法同态加密操作,得到加密一阶导数和加