预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112883387A(43)申请公布日2021.06.01(21)申请号202110134260.8(22)申请日2021.01.29(71)申请人南京航空航天大学地址210016江苏省南京市秦淮区御道街29号(72)发明人赵彦超陈嘉乐张佳乐杨子路(74)专利代理机构南京苏高专利商标事务所(普通合伙)32204代理人柏尚春(51)Int.Cl.G06F21/60(2013.01)G06F21/62(2013.01)权利要求书1页说明书9页附图4页(54)发明名称一种面向机器学习全流程的隐私保护方法(57)摘要本发明公开了一种面向机器学习全流程的隐私保护方法,包括以下内容:1)在数据训练阶段,基于隐私保护数据聚合算法进行模型训练,用户数据保留在本地计算训练,仅通过模型参数同中央服务器之间直接交互;有效保护了用户数据在训练阶段的安全隐私。2)针对模型数据,采用改良的Blowfish分组密码算法来对用户的模型数据进行隐私保护,实现用户模型数据的轻量级加解密;3)在推理阶段,基于安全多方计算的智能算法进行隐私保护,再基于安全共享实现进行数据安全交互,从而实现各个机器学习算法的加密预测功能。CN112883387ACN112883387A权利要求书1/1页1.一种面向机器学习全流程的隐私保护方法,其特征在于,包括以下步骤:(1)在数据训练阶段,基于隐私保护数据聚合算法进行模型训练,用户数据保留在本地计算训练,仅通过模型参数同中央服务器之间直接交互;(2)针对模型数据,采用改良的Blowfish分组密码算法来对用户的模型数据进行隐私保护,实现用户模型数据的轻量级加解密;(3)在推理阶段,基于安全多方计算的智能算法进行隐私保护。2.根据权利要求1所述的一种面向机器学习全流程的隐私保护方法,其特征在于:步骤(1)具体包括如下内容:定义有N个参与训练的节点,每个节点的数据在本地进行模型训练,仅将学习到的模型参数发送中央服务器,再通过安全聚合得到主模型;服务器将安全聚合得到的主模型发回还给这些节点,并重复此过程;其主要步骤为:对N个节点进行选择,在选择结束的报告阶段,服务器将等待每个节点返回训练后的梯度参数;服务器接收到参数后,使用隐私保护数据聚合算法来聚合它们并通知节点下一个请求时间;由每个节点训练的模型在训练过程中不会互相干扰。在每个用户返回梯度之前,需要在测试数据集上运行本地模型,并使用测试准确性来评估模型的精确度,模型的精确度也是用户选择阶段的关键参考指标。该过程重复多次,直到全局模型收敛为止。3.根据权利要求1所述的一种面向机器学习全流程的隐私保护方法,其特征在于,步骤(2)包括如下内容:(2.1)在密钥预处理过程,Blowfish算法使用原密钥的p盒与s盒来对输入的密钥进行预处理;(2.2)在密钥加密过程,Blowfish算法先对待加密的明文数据进行分组,将明文数据分为左右两个块L_0与R_0;第i轮的加密过程依赖于第i‑1轮的加密结果:L_i=R_i‑1;R_i=L_i‑1xorF(R_i‑1,K_i‑1);(2.3)在密钥解密过程,由于Blowfish算法的对称特性,其解密过程就是加密过程的逆过程,因此解密过程中使用与加密过程相同的密钥,在解密前也需要对密钥进行预处理。4.根据权利要求3所述的一种面向机器学习全流程的隐私保护方法,其特征在于,在解密前对密钥进行预处理时,直接使用加密前密钥的预处理结果来使用。5.根据权利要求1所述的一种面向机器学习全流程的隐私保护方法,其特征在于,步骤(3)中,用户数据在本地加密后发送给服务器,而服务器直接在密文上进行推理计算,无须解密,推理结果返回给用户,再由用户自动解密,得到推理结果;使用同态加法、同态乘法算法来构造卷积,池化、近似各激活函数,再基于安全共享进行数据安全交互,构建安全的、隐私保护的机器学习推理。6.根据权利要求5所述的一种面向机器学习全流程的隐私保护方法,步骤(3)中,采用Paillier加密算法,面向加法和乘法采取密文计算。7.根据权利要求5所述的一种面向机器学习全流程的隐私保护方法,步骤(3)中,数据完成加密后,数据的传输交互采用基于SPDZ协议的秘密共享技术完成。2CN112883387A说明书1/9页一种面向机器学习全流程的隐私保护方法技术领域[0001]本发明涉及人工智能安全隐私保护方法,具体涉及一种面向机器学习全流程的隐私保护方法。背景技术[0002]机器学习已被证明是一种非常有效的用于产生、预测模型的工具,该预测模型广泛应用于医疗保健,图像分类,财务等应用中。随着训练数据量的增加,这些模型的准确性变得更好。机器学习模型可以通过汇总多个贡献者的数据来获取大量训练数据,但是通常参与机器学习计算