预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111291416A(43)申请公布日2020.06.16(21)申请号202010384190.7(22)申请日2020.05.09(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人李龙飞周俊(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06F21/62(2013.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书11页附图3页(54)发明名称基于隐私保护对业务模型进行数据预处理的方法及装置(57)摘要本说明书实施例提供一种基于隐私保护对业务模型进行数据预处理的方法,在对业务模型进行数据预处理过程中,通过将业务模型的前半部分设置在可信的第一环境中,可以有效保护数据隐私。同时由于可信环境中的数据处理速度变慢,结合设置在第二环境中的第二部分,可以进行模型训练过程加速,提高数据处理效率。进一步地,通过第一部分和第二部分的动态切分,可以保证第一部分的处理结果有效保护数据隐私。总之,本说明书实施例描述的技术方案可以提高基于隐私保护的数据预处理过程的有效性。CN111291416ACN111291416A权利要求书1/3页1.一种基于隐私保护对业务模型进行数据预处理的方法,其中,所述业务模型用于对相关业务数据进行处理,以确定相应的业务处理结果,所述业务模型包括,设于可信的第一环境中的第一部分和设于第二环境中的第二部分;所述方法在所述第一环境中执行,包括:获取第一样本数据,所述第一样本数据包括第一业务数据及第一样本标签;利用所述第一部分对所述第一业务数据进行处理,得到第一中间向量;利用预定的编码方式对所述第一业务数据进行语义编码,得到第二中间向量,所述第二中间向量与所述第一中间向量维度一致;检测所述第一中间向量与所述第二中间向量的第一相似性;在所述第一相似性不满足预定条件的情况下,更新所述第一部分和所述第二部分的分配份额,使得更新后的第一部分在所述业务模型中的占比提高,从而利用更新后的第一部分和第二部分,进行所述业务模型的数据预处理。2.根据权利要求1所述的方法,所述第一相似性通过所述第一中间向量和所述第二中间向量的相似度来衡量,所述预定条件包括,所述第一中间向量与所述第二中间向量的相似度低于预定阈值。3.根据权利要求1所述的方法,其中,在所述第一相似性满足预定条件的情况下,将所述第一中间向量及所述第一样本标签传递给所述第二部分,以根据所述第二部分反馈的梯度数据,调整所述第一部分的模型参数。4.根据权利要求1所述的方法,其中,所述业务模型为n层神经网络,所述第一部分包括所述n层神经网络中排列靠前的m层,所述第二部分包括所述n层神经网络中排列靠后的n-m层,所述更新所述第一部分和所述第二部分的分配份额还包括:从所述第二部分中获取所述n层神经网络中的第m+1至第m+t层神经网络,从而将所述第一部分更新为所述n层神经网络中排列靠前的m+t层,将所述第二部分更新为所述n层神经网络中排列靠后的n-m-t层。5.根据权利要求4所述的方法,所述方法还包括:通过第m+1至m+t层神经网络处理所述第一中间向量,得到第三中间向量;检测所述第三中间向量与所述第二中间向量的第二相似性;在所述第二相似性满足所述预定条件的情况下,将所述第三中间向量传递给更新后的第二部分。6.根据权利要求5所述的方法,其中,在所述第三中间向量和所述第二中间向量维数不一致的情况下,所述检测所述第三中间向量与所述第二中间向量的第二相似性还包括:利用所述编码方式更新所述第二中间向量,使得更新后的第二中间向量与所述第三中间向量的维度一致;检测更新后的第二中间向量与所述第三中间向量的第二相似性。7.根据权利要求1所述的方法,其中,所述方法还包括:在所述业务模型的模型指标满足预定的指标条件的情况下,根据所述第一部分的处理结果采集所述第一业务数据的指纹信息。8.根据权利要求1所述的方法,其中,所述第一样本数据为由业务方加密后提供的加密数据,所述获取所述第一样本数据还包括:获取针对所述业务方的样本数据的认证标识;2CN111291416A权利要求书2/3页根据所述认证标识对所述加密数据进行认证;在认证通过的情况下,对所述加密数据进行解密,得到所述第一样本数据。9.一种基于隐私保护利用业务模型处理业务数据的方法,其中,所述业务模型用于对相关业务数据进行处理,以确定相应的业务处理结果,并通过权利要求1所述的方式进行预处理,所述业务模型包括,设于可信的第一环境中的第一部分和设于第二环境中的第二部分;所述方法在所述第一环境中执行,包括:获取待处理的当前