联邦学习模型的训练方法、装置、电子设备和存储介质-豆柴文库

联邦学习模型的训练方法、装置、电子设备和存储介质.pdf

2023-07-24

10金币

1.4MB

36页

fu****级甜

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共36页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113947211A(43)申请公布日2022.01.18(21)申请号202111183940.5(22)申请日2021.10.11(71)申请人京东科技控股股份有限公司地址100176北京市北京经济技术开发区科创十一街18号C座2层221室(72)发明人杨恺王虎黄志翔彭南博(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人罗岚(51)Int.Cl.G06N20/00(2019.01)H04L9/00(2022.01)H04L9/40(2022.01)权利要求书5页说明书22页附图8页(54)发明名称联邦学习模型的训练方法、装置、电子设备和存储介质(57)摘要本申请提出一种联邦学习模型的训练方法、装置、电子设备和存储介质，其中，训练方法包括：与数据提供方服务器进行样本对齐；根据业务方服务器和数据提供方服务器的特征数量分别对业务方服务器和数据提供方服务器的特征进行编号，以生成特征编码集，以及将数据提供方服务器的特征编号和公钥发送至数据提供方服务器；获取联邦学习模型的当前样本集和训练参数集；根据当前样本集、训练参数集和特征编码集，对联邦学习模型进行M次迭代训练；以及获取第M次迭代训练得到的联邦学习模型的目标参数。由此，能够在保证建模效果的同时减少建模的复杂度，从而使业务方服务器与数据提供方服务器之间的联合训练更加高效，进而提高了建模效率。CN113947211ACN113947211A权利要求书1/5页1.一种联邦学习模型的训练方法，其特征在于，包括：与数据提供方服务器进行样本对齐；分别获取业务方服务器和所述数据提供方服务器的特征数量，并根据所述特征数量分别对所述业务方服务器和所述数据提供方服务器的特征进行编号，以生成特征编码集，以及将所述数据提供方服务器的特征编号和公钥发送至所述数据提供方服务器；获取联邦学习模型的当前样本集和训练参数集；根据所述当前样本集、所述训练参数集和所述特征编码集，对所述联邦学习模型进行M次迭代训练，其中，所述M为大于1的正整数；以及获取第M次所述迭代训练得到的所述联邦学习模型的目标参数。2.如权利要求1所述的联邦学习模型的训练方法，其特征在于，其中，所述训练参数集包括特征采样率、训练样本上限值、训练样本下限值、决策树棵数上限值、决策树棵数下限值、第一参数变化速度和第二参数变化速度。3.如权利要求2所述的联邦学习模型的训练方法，其特征在于，其中，所述每次迭代训练，包括：将所述M次迭代训练中当前的迭代训练作为第N次迭代训练，其中，所述N为小于所述M的正整数；根据所述M、所述N、所述训练样本上限值、所述训练样本下限值和所述第一参数变化速度，生成样本采样率；根据所述M、所述N、所述决策树棵数上限值、所述决策树棵数下限值和所述第二参数变化速度，生成目标棵数；从所述当前样本集中选取所述样本采样率的样本以生成目标训练集；从所述特征编码集中选取所述特征采样率的特征编码以生成目标特征编码集；将所述目标训练集中每个样本的编号，以及所述目标特征编码集中所述数据提供方服务器的目标特征编号发送至所述数据提供方服务器；根据所述目标训练集、所述目标特征编码集和所述目标棵数，生成所述联邦学习模型的目标参数；基于梯度提升算法，并根据所述目标参数和所述联邦学习模型，生成所述当前样本的优化标签，其中，所述优化标签为下一轮迭代训练的所述当前样本的训练标签。4.如权利要求3所述的联邦学习模型的训练方法，其特征在于，所述根据所述目标训练集、所述目标特征编码集和所述目标棵数，生成所述联邦学习模型的目标参数，包括：计算所述目标训练集中样本的梯度信息，并将所述梯度信息发送至所述数据提供方服务器；接收所述数据提供方服务器提供的梯度返回信息；根据所述梯度返回信息和所述目标特征编码集生成目标分裂点编号，并基于私钥和所述目标分裂点编号生成密文，以及将所述密文发送至所述数据提供方服务器；接收所述数据提供方服务器发送的解密运算值，并根据所述解密运算值进行节点分裂；重复以上步骤直至模型收敛，以建立所述目标棵数的决策树，完成所述联邦学习模型的训练，并通过所述完成训练的联邦学习模型获取所述目标参数。2CN113947211A权利要求书2/5页5.如权利要求4所述的联邦学习模型的训练方法，其特征在于，所述计算所述目标训练集中样本的梯度信息，包括：生成所述目标训练集中样本的一阶梯度值和二阶梯度值；对所述一阶梯度值和所述二阶梯度值进行同态加密以生成所述梯度信息。6.如权利要求4所述的联邦学习模型的训练方法，其特征在于，所述梯度返回信息为多个，且每个所述梯度返回信息对应有相应的编号，其中，所述根据所述梯度返回信息和所述目标特征编码集生成目标分裂点编号，包括：根据所述多个梯度

相关资料

联邦学习模型的训练方法、装置、电子设备和存储介质.pdf

本申请提出一种联邦学习模型的训练方法、装置、电子设备和存储介质，其中，训练方法包括：与数据提供方服务器进行样本对齐；根据业务方服务器和数据提供方服务器的特征数量分别对业务方服务器和数据提供方服务器的特征进行编号，以生成特征编码集，以及将数据提供方服务器的特征编号和公钥发送至数据提供方服务器；获取联邦学习模型的当前样本集和训练参数集；根据当前样本集、训练参数集和特征编码集，对联邦学习模型进行M次迭代训练；以及获取第M次迭代训练得到的联邦学习模型的目标参数。由此，能够在保证建模效果的同时减少建模的复杂度，从而

2023-07-24

1.4MB

联邦学习模型的训练方法、装置、电子设备和存储介质.pdf

本申请提出一种联邦学习模型的训练方法、装置、电子设备和存储介质，其中，训练方法包括：与数据提供方服务器进行样本对齐；生成特征编码集，以及将数据提供方服务器的特征编号和公钥发送至数据提供方服务器；将当前样本划分为训练集和验证集，并获取联邦学习模型的参数集；根据训练集、验证集、参数集和特征编码集，对联邦学习模型进行M次迭代训练；在M次迭代训练中每次迭代训练的过程中，若判断联邦学习模型满足早停条件，则控制M次迭代训练早停，并获取M次迭代训练中最后一次迭代训练得到的联邦学习模型的目标参数。由此，能够使训练更加高效

2023-07-25

1.4MB

联邦学习模型的训练方法、装置、电子设备和存储介质.pdf

本申请提出一种联邦学习模型的训练方法、装置和电子设备，其中，训练方法包括：与数据提供方服务器进行样本对齐；计算当前样本的梯度信息，并发送至数据提供方服务器；接收数据提供方服务器提供的公钥、假消息集以及梯度返回信息；根据梯度返回信息生成目标分裂点编号，并基于公钥、假消息集和目标分裂点编号生成密文，并将密文发送至数据提供方服务器；以及接收数据提供方服务器发送的每个假消息对应的解密运算值，并根据每个假消息对应的解密运算值进行节点分裂。由此，能够有效地防止模型提取攻击和模型逆向攻击，实现了保护业务方的模型和训练数

2023-07-25

864KB

基于联邦学习的模型训练方法、装置、设备及存储介质.pdf

本申请涉及人工智能技术领域，揭示了一种基于联邦学习的模型训练方法、装置、设备及存储介质，其中方法包括：获取第m轮联邦学习的第i次迭代的各个目标客户端发送的单模型训练样本数量和单模型参数矩阵；将目标客户端的数量作为参与训练机构数量；根据所有单模型训练样本数量得到训练样本总数；根据参与训练机构数量、所有单模型参数矩阵、所有单模型训练样本数量和第i‑1次迭代的模型参数汇总矩阵计算第i次迭代的模型参数汇总矩阵；根据参与训练机构数量确定待更新的学习率；将训练样本总数、待更新的学习率和第i次迭代的模型参数汇总矩阵发送

2023-07-25

783KB

模型训练方法和装置、电子设备、存储介质.pdf

本实施例提供一种模型训练方法和装置、电子设备、存储介质，属于机器学习技术领域。该方法包括：通过将联邦学习与区块链技术进行结合，使想要记账的记账节点从原始区块链中获取记账权，不再依赖于单一的中心节点记账，提高模型训练的安全性，记账节点根据记账权更新本地模型的初始模型参数，得到目标模型参数，根据目标模型参数，记账节点将预记账的新区块添加至原始区块链中，得到当前区块，记账节点获取当前区块链的区块模型参数，根据区块模型参数的梯度更新本地模型，得到目标模型，通过不断更新区块模型参数来更新本地模型，得到目标模型，能够

2023-07-24

633KB