预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113515770A(43)申请公布日2021.10.19(21)申请号202010626329.4(22)申请日2020.04.10(62)分案原申请数据202010276685.82020.04.10(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人熊涛(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06F21/62(2013.01)G06N3/08(2006.01)权利要求书2页说明书12页附图3页(54)发明名称基于隐私保护确定目标业务模型的方法及装置(57)摘要本说明书实施例提供一种基于隐私保护确定目标业务模型的方法和装置,先对选定的复杂业务模型进行初始训练,得到初始业务模型,然后对初始业务模型进行修剪,并对修剪后的业务模型进行训练,得到相应模型指标。对于得到的多个子模型,通过差分隐私的指数机制,利用相应模型指标确定各个业务模型分别对应的各个采样概率,并基于采样概率对多个子模型进行采样,从而选择目标业务模型。这样,可以利用差分隐私方式获取隐私保护的压缩模型,在实现模型压缩的基础上,为模型提供隐私保护。CN113515770ACN113515770A权利要求书1/2页1.一种基于隐私保护确定目标业务模型的方法,所述目标业务模型用于处理给定的业务数据,得到相应的业务预测结果;所述方法包括:使用多个训练样本训练选定的业务模型至模型参数收敛,得到初始业务模型;基于对所述初始业务模型的修剪,确定所述初始业务模型的多个子模型,其中,各个子模型各自对应有通过重新训练确定的模型参数以及模型指标,所述模型指标用于评价相应子模型收敛情况下的模型性能;利用差分隐私的指数机制,基于各个子模型各自对应的模型指标,确定各个子模型分别对应的各个采样概率;按照各个采样概率对各个子模型进行采样,从而选择出目标业务模型。2.根据权利要求1所述的方法,其中,所述基于对所述初始业务模型的修剪,确定所述初始业务模型的多个子模型包括:按照所述初始业务模型的模型参数,对所述初始业务模型进行修剪,得到第一修剪模型;将对应有经过重新训练得到的模型参数的第一修剪模型,作为第一子模型;迭代修剪所述第一子模型得到后续子模型,直至满足结束条件。3.根据权利要求2所述的方法,所述结束条件包括,迭代次数达到预定次数、子模型数量达到预定数量、最后一个子模型的规模小于设定的规模阈值中的至少一项。4.根据权利要求1或2所述的方法,其中,对所述初始业务模型的修剪基于以下之一的方式,按照模型参数由小到大的顺序进行:修剪掉预定比例的模型参数、修剪掉预定数量的模型参数、修剪得到规模不超过预定大小的模型。5.根据权利要求1所述的方法,其中,所述利用差分隐私的指数机制,基于各个子模型各自对应的模型指标,确定各个子模型分别对应的各个采样概率包括:按照各个子模型各自对应的模型指标,确定各个子模型分别对应的各个可用性系数;根据各个可用性系数,利用指数机制确定各个子模型分别对应的各个采样概率。6.根据权利要求5所述的方法,其中,所述模型指标包括相对于所述初始业务模型的压缩率,以及以下中的至少一项:准确度、召回率、F1分数,所述可用性系数为所述压缩率与所述模型指标所包含的其他项的乘积。7.根据权利要求1所述的方法,其中,所述方法还包括:利用多个训练样本对所述目标业务模型基于差分隐私的第二方式进行训练,使得训练后的目标业务模型用于针对给定的业务数据进行保护数据隐私的业务预测。8.根据权利要求7所述的方法,其中,所述多个训练样本包括第一批样本,所述第一批样本中的样本i对应有经所述目标业务模型处理后得到的损失,所述利用多个训练样本对所述目标业务模型基于差分隐私的第二方式进行训练包括:确定所述样本i对应的损失的原始梯度;利用所述差分隐私的第二方式在所述原始梯度上添加噪声,得到包含噪声的梯度;利用所述包含噪声的梯度,以最小化所述样本i对应的损失为目标,调整所述目标业务模型的模型参数。9.根据权利要求8所述的方法,其中,所述差分隐私的第二方式为添加高斯噪声,所述利用所述差分隐私的第二方式在所述原始梯度上添加噪声,得到包含噪声的梯度包括:2CN113515770A权利要求书2/2页基于预设的裁剪阈值,对所述原始梯度进行裁剪,得到裁剪梯度;利用基于所述裁剪阈值确定的高斯分布,确定用于实现差分隐私的高斯噪声,其中,所述高斯分布的方差与所述裁剪阈值的平方正相关;将所述高斯噪声与所述裁剪梯度叠加,得到所述包含噪声的梯度。10.根据权利要求1所述的方法,其中,所述业务数据包括图片、音频、字符中的至少一项。11.一种基于