基于多方安全计算的机器学习模型训练及预测方法、装置-豆柴文库

基于多方安全计算的机器学习模型训练及预测方法、装置.pdf

2023-05-25

10金币

714KB

23页

雨巷****轶丽

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共23页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111061963A(43)申请公布日2020.04.24(21)申请号201911194334.6(22)申请日2019.11.28(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人陈超超王力周俊(74)专利代理机构北京永新同创知识产权代理有限公司11376代理人林锦辉(51)Int.Cl.G06F16/9536(2019.01)G06F21/62(2013.01)权利要求书3页说明书13页附图6页(54)发明名称基于多方安全计算的机器学习模型训练及预测方法、装置(57)摘要本说明书实施例提供基于多方安全计算的非线性机器学习模型训练方法、模型预测方法及装置。非线性机器学习模型被分解为多个子模型，每个子模型部署在对应训练参与方处。在每次循环时，将非线性机器学习模型的模型计算分割为至少一个第一模型计算和至少一个第二模型计算。针对各个第一模型计算，经由各个训练参与方使用对应模型参数以及训练样本数据或者在前第二模型计算的计算结果来进行多方安全计算。针对各个第二模型计算，使用在前第一模型计算的计算结果来在可信计算设备的可信执行环境中进行可信计算。在循环未结束时，根据预测差值调整各个训练参与方的子模型。利用该方法，能够在确保隐私数据安全的情况下提高模型训练效率。CN111061963ACN111061963A权利要求书1/3页1.一种基于多方安全计算的非线性机器学习模型训练方法，其中，所述非线性机器学习模型利用第一数目个训练参与方协同训练并且被分解为第一数目个子模型，每个训练参与方具有一个子模型，所述方法包括：执行下述循环过程，直到满足循环结束条件：将训练样本数据提供给当前非线性机器学习模型，以经由各个训练参与方和可信计算设备配合计算来得到所述当前非线性机器学习模型的当前预测值，其中，所述当前非线性机器学习模型的模型计算被按照第一模型计算和第二模型计算间隔的方式分割为至少一个第一模型计算和至少一个第二模型计算，所述第一模型计算是线性模型计算，所述第二模型计算包括非线性模型计算，针对各个第一模型计算，经由各个训练参与方，使用各自当前子模型的对应模型参数以及所述训练样本数据或者在前第二模型计算的计算结果来进行多方安全计算，以得到该第一模型计算的计算结果，以及针对各个第二模型计算，使用在前第一模型计算的计算结果来在所述可信计算设备的可信执行环境中进行可信计算，以得到该第二模型计算的计算结果；基于所述当前预测值和样本标记值，确定当前预测差值；以及在不满足所述循环结束条件时，根据所述当前预测差值，调整各个训练参与方处的子模型，所述调整后的各个训练参与方处的子模型充当下一循环过程的各个训练参与方处的当前子模型。2.如权利要求1所述的非线性机器学习模型训练方法，其中，各个训练参与方与所述可信计算设备之间交互的计算结果是经过加密后的计算结果。3.如权利要求1所述的非线性机器学习模型训练方法，其中，所述第二模型计算还包括线性模型计算，以及所述第一模型计算的数目根据用于模型训练的算力、应用场景所要求的训练时效性和/或模型训练精度来确定。4.如权利要求1所述的非线性机器学习模型训练方法，其中，所述可信计算设备包括SGX设备或TrustZone设备。5.如权利要求1所述的非线性机器学习模型训练方法，其中，所述当前预测差值的确定过程在所述可信计算设备执行或者在拥有所述样本标记值的训练参与方处执行。6.如权利要求1所述的非线性机器学习模型训练方法，其中，所述循环结束条件包括：循环次数达到预定次数；或者当前预测差值在预定差值范围内。7.如权利要求1所述的非线性机器学习模型训练方法，其中，所述多方安全计算包括秘密共享、混淆电路和同态加密中的一种。8.如权利要求1所述的非线性机器学习模型训练方法，其中，所述非线性机器学习模型包括逻辑回归模型或者神经网络模型。9.如权利要求1到8中任何一个所述的非线性机器学习模型训练方法，其中，所述训练样本数据包括基于图像数据、语音数据或者文本数据的训练样本数据，或者所述训练样本数据包括用户特征数据。10.一种基于非线性机器学习模型的模型预测方法，其中，所述非线性机器学习模型经由第一数目个模型拥有方协同训练出并且被分解为第一数目个子模型，每个模型拥有方具有一个子模型，所述模型预测方法包括：2CN111061963A权利要求书2/3页接收待预测数据；以及将所述待预测数据提供给非线性机器学习模型，以经由各个模型拥有方和可信计算设备配合计算来得到所述非线性机器学习模型的预测值，其中，所述非线性机器学习模型的模型计算被按照第一模型计算和第二模型计算间隔的方式分割为至少一个第一模型计算和至少一个第

相关资料

基于多方安全计算的机器学习模型训练及预测方法、装置.pdf

本说明书实施例提供基于多方安全计算的非线性机器学习模型训练方法、模型预测方法及装置。非线性机器学习模型被分解为多个子模型，每个子模型部署在对应训练参与方处。在每次循环时，将非线性机器学习模型的模型计算分割为至少一个第一模型计算和至少一个第二模型计算。针对各个第一模型计算，经由各个训练参与方使用对应模型参数以及训练样本数据或者在前第二模型计算的计算结果来进行多方安全计算。针对各个第二模型计算，使用在前第一模型计算的计算结果来在可信计算设备的可信执行环境中进行可信计算。在循环未结束时，根据预测差值调整各个训练

2023-05-25

714KB

基于多方安全计算训练模型的方法及装置.pdf

本说明书实施例提供一种基于多方安全计算训练模型的方法及装置，在多方联合利用各自的隐私数据进行基于逻辑回归的分类模型训练过程中，通过目标映射函数代替常规的sigmoid函数进行数据分类，以减少基于逻辑回归进行分类的分类模型在多方安全计算场景下的数据处理的复杂度，提高模型训练效率。其中，在目标映射函数满足在远离0的位置具有较高准确度的条件的情况下，可以提高分类准确度。如此，可以提高多方安全计算场景下联合训练基于逻辑回归的分类模型的可行性。

2023-05-25

1.3MB

基于多方安全计算的神经网络模型训练及预测方法、装置.pdf

本说明书实施例提供基于多方安全计算的神经网络模型训练方法、模型预测方法及装置。神经网络模型被分割为至少一个客户端模型和至少一个服务端模型，服务端模型部署在服务端，客户端模型部署在对应训练参与方的客户端。在每次循环时，训练样本数据被提供给神经网络模型来得到当前预测值和当前预测差值。在各个客户端模型，经由各个训练参与方使用各自的客户端子模型以及所接收的数据逐层进行多方安全计算。在各个服务端模型，使用在前客户端模型的计算结果逐层进行非多方安全计算。在循环未结束时，根据当前预测差值，通过反向传播来调整服务端模型和

2023-05-25

1.2MB

基于多方安全计算的树模型的训练方法和业务预测方法.pdf

本公开实施例提供一种基于多方安全计算的树模型的训练方法和业务预测方法，树模型由参与多方安全计算的多方共同训练，多方包括第一数据拥有方和至少一个第二数据拥有方，第一数据拥有方具有各训练样本对应的第一样本标签，第二数据拥有方具有训练样本对应的第二样本标签；该方法包括：第一数据拥有方接收第二数据拥有方发送的每个训练样本分别对应的第二加密中间参数；基于本轮迭代对应的分裂特征，将各训练样本划分得到样本集合；将样本集合中样本的第二加密中间参数统计后返回至第二数据拥有方；对于每个训练样本，根据第一样本标签获得第一中间参

2023-05-25

739KB

基于多方数据协同的预测模型训练、数据预测方法和装置.pdf

本发明提供一种基于多方数据协同的预测模型训练、数据预测方法和装置，通过在每轮全局训练过程中，各电力部门系统在本地对用电量预测模型进行训练得到模型参数训练值的同时，还确定用电量预测模型的候选剪枝参数，以供数据中心对各电力部门系统传递的模型参数训练值进行聚合，得到当前参数值，并基于各电力部门系统传递的候选剪枝参数确定实际剪枝参数，使各电力部门系统在进行本地训练时可以不必考虑上述实际剪枝参数，降低了需要进行参数更新的参数量，降低了训练难度和训练成本；同时，当各电力部门系统生成的新一轮的模型参数训练值仅包含除当前

2023-08-20

774KB