预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111177792A(43)申请公布日2020.05.19(21)申请号202010276685.8(22)申请日2020.04.10(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人熊涛(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06F21/62(2013.01)G06N3/08(2006.01)权利要求书3页说明书12页附图3页(54)发明名称基于隐私保护确定目标业务模型的方法及装置(57)摘要本说明书实施例提供一种基于隐私保护确定目标业务模型的方法和装置,先对选定的复杂业务模型进行初始训练,得到初始业务模型,然后对初始业务模型进行修剪,并对修剪后的业务模型在参数重置回初始化状态的情形下进行训练,以考验修剪掉的模型参数是否自始不重要。对于得到的多个子模型,通过差分隐私的方式,从中选择目标业务模型。这样,可以获取隐私保护的压缩模型,在实现模型压缩的基础上,为模型提供隐私保护。CN111177792ACN111177792A权利要求书1/3页1.一种基于隐私保护确定目标业务模型的方法,所述目标业务模型用于处理给定的业务数据,得到相应的业务预测结果;所述方法包括:按照预定方式为选定的业务模型确定各个模型参数分别对应的初始值,从而初始化所述选定的业务模型;使用多个训练样本训练经过初始化的所述选定的业务模型至模型参数收敛,得到初始业务模型;基于对所述初始业务模型的修剪,确定所述初始业务模型的多个子模型,其中,各个子模型各自对应有通过以下方式重新训练确定的模型参数以及模型指标:将修剪后的业务模型的模型参数重置为初始化的业务模型中的相应模型参数的初始值;将多个训练样本依次输入修剪后的业务模型,并基于相应样本标签与修剪后的业务模型的输出结果的对比,调整模型参数;基于各个子模型各自对应的模型指标,利用差分隐私的第一方式从各个子模型中选择出目标业务模型。2.根据权利要求1所述的方法,其中,所述基于对所述初始业务模型的修剪,确定所述初始业务模型的多个子模型包括:按照所述初始业务模型的模型参数,对所述初始业务模型进行修剪,得到第一修剪模型;将对应有经过重新训练得到的模型参数的第一修剪模型,作为第一子模型;迭代修剪所述第一子模型得到后续子模型,直至满足结束条件。3.根据权利要求2所述的方法,所述结束条件包括,迭代次数达到预定次数、子模型数量达到预定数量、最后一个子模型的规模小于设定的规模阈值中的至少一项。4.根据权利要求1或2所述的方法,其中,对模型的修剪基于以下之一的方式,按照模型参数由小到大的顺序进行:修剪掉预定比例的模型参数、修剪掉预定数量的模型参数、修剪得到规模不超过预定大小的模型。5.根据权利要求1所述的方法,其中,所述差分隐私的第一方式为指数机制,所述基于各个子模型各自对应的模型指标,利用差分隐私的第一方式从各个子模型中选择出目标业务模型包括:按照各个子模型各自对应的模型指标,确定各个子模型分别对应的各个可用性系数;根据各个可用性系数,利用指数机制确定各个子模型分别对应的各个采样概率;按照各个采样概率在所述多个子模型中采样,将被采样到的子模型作为目标业务模型。6.根据权利要求1所述的方法,其中,所述方法还包括:利用多个训练样本对所述目标业务模型基于差分隐私的第二方式进行训练,使得训练后的目标业务模型用于针对给定的业务数据进行保护数据隐私的业务预测。7.根据权利要求6所述的方法,其中,所述多个训练样本包括第一批样本,所述第一批样本中的样本i对应有经所述目标业务模型处理后得到的损失,所述利用多个训练样本对所述目标业务模型基于差分隐私的第二方式进行训练包括:确定所述样本i对应的损失的原始梯度;利用所述差分隐私的第二方式在所述原始梯度上添加噪声,得到包含噪声的梯度;2CN111177792A权利要求书2/3页利用所述包含噪声的梯度,以最小化所述样本i对应的损失为目标,调整所述目标业务模型的模型参数。8.根据权利要求7所述的方法,其中,所述差分隐私的第二方式为添加高斯噪声,所述利用所述差分隐私的第二方式在所述原始梯度上添加噪声,得到包含噪声的梯度包括:基于预设的裁剪阈值,对所述原始梯度进行裁剪,得到裁剪梯度;利用基于所述裁剪阈值确定的高斯分布,确定用于实现差分隐私的高斯噪声,其中,所述高斯分布的方差与所述裁剪阈值的平方正相关;将所述高斯噪声与所述裁剪梯度叠加,得到所述包含噪声的梯度。9.根据权利要求1所述的方法,其中,所述业务数据包括图片、音频、字符中的至少一项。10.一种基于隐私保护确定目标业务模型的装置,所述目标业务模型用于处理