预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114692197A(43)申请公布日2022.07.01(21)申请号202210093551.1(22)申请日2022.01.26(71)申请人索尼集团公司地址日本东京(72)发明人吕灵娟(74)专利代理机构中国贸促会专利商标事务所有限公司11038专利代理师汪晶晶(51)Int.Cl.G06F21/62(2013.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书1页说明书15页附图6页(54)发明名称用于隐私保护的方法、装置和系统(57)摘要本公开内容涉及用于隐私保护的方法、装置和系统。描述了关于隐私保护的各种实施例。在一个实施例中,一种模型训练方法包括:获取实际数据集;通过在保留实际数据集中的实际数据的主要特征的同时压缩实际数据集的大小,对实际数据集进行数据集浓缩以去除隐私信息;以及使用经数据集浓缩得到浓缩数据集来训练模型。CN114692197ACN114692197A权利要求书1/1页1.一种模型训练方法,包括:获取实际数据集;通过在保留实际数据集中的实际数据的主要特征的同时压缩实际数据集的大小,对实际数据集进行数据集浓缩以去除隐私信息;以及使用经数据集浓缩得到浓缩数据集来训练模型。2.根据权利要求1所述的方法,其中,对实际数据集进行数据集浓缩包括:建立初始的浓缩数据集,其中,所建立的浓缩数据集小于实际数据集;以及对浓缩数据集进行优化,使得浓缩数据集具有实际数据集中的实际数据的主要特征。3.根据权利要求1所述的方法,其中,所述方法还包括:判断获取的实际数据集中是否包含隐私信息,以及在对实际数据集进行数据集浓缩中,仅对包含隐私信息的实际数据集进行数据集浓缩。4.一种模型部署方法,包括:部署执行根据权利要求1‑3中任一项所述的方法得到的经训练的模型,以处理数据,其中,用于得到所述经训练的模型的实际数据与待处理数据具有相同的分布。5.一种训练装置,包括:数据获取模块,被配置为获取实际数据集;数据集浓缩模块,被配置为通过在保留实际数据集中的实际数据的主要特征的同时压缩实际数据集的大小,对实际数据集进行数据集浓缩以去除隐私信息;以及训练模块,被配置为使用经数据集浓缩得到浓缩数据集来训练模型。6.一种应用装置,包括处理设备,所述处理设备被配置为执行根据权利要求4所述方法的步骤。7.一种用于隐私保护的系统,包括:根据权利要求5所述的训练装置;以及应用装置,被配置为部署由训练装置得到的经训练的模型,以处理数据,其中,用于得到经训练的模型的实际数据与待处理数据具有相同的分布。8.一种计算机可读存储介质,其上存储有一个或多个指令,所述指令在由处理器执行时,使处理器执行根据权利要求1‑3中任一项所述方法的步骤和/或根据权利要求4所述方法的步骤。9.一种计算机程序产品,包括一个或多个指令,所述指令在由处理器执行时,使处理器执行根据权利要求1‑3中任一项所述方法的步骤和/或根据权利要求4所述方法的步骤。10.一种产生模型的方法,包括:执行根据权利要求1‑3中任一项所述方法的步骤来产生模型。2CN114692197A说明书1/15页用于隐私保护的方法、装置和系统技术领域[0001]本公开一般地涉及隐私保护,并且具体地涉及人工智能领域的隐私保护。背景技术[0002]随着深度学习技术的不断发展,神经网络模型已被广泛地部署于包括边缘计算设备在内的各种系统和装置上。为了更好的提升模型在实际应用中的性能,可以使用实际数据来训练模型。但是,由于实际数据可能包含诸如客户特征之类的成员隐私信息(membershipprivacy),直接使用实际数据来训练模型具有隐私泄露的风险。[0003]一种现有的隐私保护技术路线是使用差分隐私技术。然而,该类方法对性能影响较大,且算力要求较高,训练过程收敛较慢,无法满足现实的应用需求。另一种现有的隐私保护技术路线是利用数据生成模型来生成与原始数据具有相同分布的数据。然而,数据生成模型训练过程并不稳定,且依然具有泄露原始数据的风险。[0004]此外,在“万物互联时代”,企业对于用户个人隐私信息的采集和存储数量迎来爆发式的增长,如何在促进数据流通共享,助推企业和产业升级的同时,又尊重用户的个人隐私信息,确保合法合规,成为了从业者们都需要重点关注的命题。发明内容[0005]本公开的一个方面涉及模型训练方法。根据本公开的实施例,模型训练方法包括:获取实际数据集;通过在保留实际数据集中的实际数据的主要特征的同时压缩实际数据集的大小,对实际数据集进行数据集浓缩以去除隐私信息;以及使用经数据集浓缩得到浓缩数据集来训练模型。[0006]本公开的一个方面涉及模型部署方法。根据本公开的实施例,模型部署方法包括:部署执行根据本公开实施例的模型训练