预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112182633A(43)申请公布日2021.01.05(21)申请号202011232037.9(22)申请日2020.11.06(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人刘文鑫徐文浩(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06F21/60(2013.01)G06K9/62(2006.01)G06N20/20(2019.01)权利要求书3页说明书18页附图5页(54)发明名称保护隐私的模型联合训练方法及装置(57)摘要本说明书实施例提供了一种保护隐私的模型联合训练方法及装置。该联合训练由服务器和若干个终端共同进行,终端采用预测的随机化处理方式对训练所需的实际梯度进行处理,将得到的扰动梯度发送至服务器,使得服务器根据该扰动梯度得到训练后的模型的参数,而不是根据实际梯度得到训练后的模型参数。CN112182633ACN112182633A权利要求书1/3页1.一种保护隐私的模型联合训练方法,所述联合训练由服务器和若干个终端共同进行,所述方法由所述若干个终端中的任意一个执行,所述方法包括:从所述服务器获取待训练的模型;将本地的训练样本输入所述模型,根据所述模型输出的结果,确定所述模型中各个参数对应的实际梯度;根据各个参数对应的实际梯度,确定目标梯度集;针对所述目标梯度集中的各个实际梯度,采用预设的随机化处理方式,得到各个实际梯度分别对应的各个扰动梯度;将得到的各个扰动梯度发送至所述服务器,使得所述服务器根据所述若干个终端分别发送的扰动梯度聚合得到训练后的模型参数,以得到训练后的模型。2.根据权利要求1所述的方法,其中,所述目标梯度集包括任意的第一实际梯度;采用预设的随机化处理方式,得到各个实际梯度分别对应的各个扰动梯度,包括:确定第一备选梯度和第二备选梯度;根据所述第一实际梯度,选择所述第一备选梯度、第二备选梯度之一,作为所述第一实际梯度对应的扰动梯度。3.根据权利要求2所述的方法,其中,确定第一备选梯度和第二备选梯度,包括:根据预设的第一隐私预算,确定所述第一备选梯度和所述第二备选梯度,所述第一备选梯度为与所述第一隐私预算负相关的正数,所述第二备选梯度为所述第一备选梯度的相反数。4.根据权利要求3所述的方法,其中,选择所述第一备选梯度、第二备选梯度之一,作为所述第一实际梯度的扰动梯度,包括:根据所述第一实际梯度和所述第一隐私预算,确定所述第一实际梯度对应的第一概率和第二概率,所述第一概率与所述第一实际梯度以及所述第一隐私预算正相关,所述第一概率和第二概率之和为1;以所述第一概率选择所述第一备选梯度,以所述第二概率选择所述第二备选梯度,将选择结果作为所述第一实际梯度的扰动梯度。5.根据权利要求4所述的方法,其中,确定所述第一实际梯度对应的第一概率和第二概率之前,所述方法还包括:确定针对所述第一实际梯度的归一化区间,所述归一化区间是根据服务器在对各扰动梯度进行聚合时采用的聚合方式得到的;确定所述第一实际梯度对应的第一概率和第二概率,包括:根据所述归一化区间对所述第一实际梯度进行归一化;根据归一化后的第一实际梯度,确定所述第一实际梯度对应的第一概率和第二概率。6.根据权利要求1所述的方法,其中,根据各个参数对应的实际梯度,确定目标梯度集,包括:从所述各个参数对应的实际梯度中,确定出第一指定数量个最大的实际梯度;根据第一指定数量个最大的实际梯度,确定目标梯度集。7.根据权利要求6所述的方法,其中,所述第一指定数量是从所述服务器获取的,所述第一指定数量是根据以下至少一种得到的:参与训练的终端的数量、所述模型的参数的数2CN112182633A权利要求书2/3页量、所述模型距上次训练的时长。8.根据权利要求6所述的方法,其中,根据第一指定数量个最大的实际梯度,确定目标梯度集,包括:根据预设的第二隐私预算和第二指定数量,确定第三概率和第四概率,所述第二指定数量与所述第一指定数量正相关,所述第三概率和第四概率之和为1,且第三概率大于第四概率;利用第三概率对第一梯度集进行采样,利用第四概率对第二梯度集进行采样,得到所述第二指定数量个实际梯度作为目标梯度集;其中,所述第一梯度集由所述第一指定数量个最大的实际梯度构成,所述第二梯度集包括:所述各个参数对应的实际梯度中除所述第一指定数量个最大的实际梯度之外的实际梯度。9.根据权利要求8所述的方法,其中,所述第三概率还根据所述模型的参数的数量确定。10.根据权利要求1至9任一项所述的方法,其中,将得到的各扰动梯度发送至所述服务器之后,所述方法还包括:接收所述服务器返回的训练后的