一种模型联合训练的方法和系统-豆柴文库

一种模型联合训练的方法和系统.pdf

2023-05-25

10金币

690KB

14页

星星****眨眼

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共14页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113689006A(43)申请公布日2021.11.23(21)申请号202111074304.9(22)申请日2020.04.23(62)分案原申请数据202010326265.62020.04.23(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人陈超超曹绍升王力周俊(74)专利代理机构成都七星天知识产权代理有限公司51253代理人袁春晓(51)Int.Cl.G06N20/20(2019.01)权利要求书2页说明书9页附图2页(54)发明名称一种模型联合训练的方法和系统(57)摘要本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括：多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练，多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度；所述多个参与终端分别将所述各自的梯度发送给服务器；所述服务器从多个所述梯度中选取可信任梯度，并且根据选取的所述可信任梯度更新所述联合训练模型的参数；所述样本数据为文本数据、语音数据或者图形数据。CN113689006ACN113689006A权利要求书1/2页1.一种模型联合训练的方法，所述方法包括：获取多个梯度，其中，所述多个梯度由多个联合训练的参与终端分别基于所述终端自身持有的样本数据进行模型联合训练得到；计算所述多个梯度的第一平均值，并且分别比较所述多个梯度与所述第一平均值，获取多个偏差结果；基于所述多个偏差结果，从所述多个梯度中选取可信任梯度，其中，所述多个梯度中除可信任梯度外的其他梯度为可疑梯度，所述可疑梯度不被用于本次更新联合训练模型的参数；计算所述多个可信任梯度的第二平均值，并且根据所述第二平均值更新所述联合训练模型的参数；所述样本数据为文本数据、语音数据或者图形数据。2.根据权利要求1所述的方法，其中，所述从所述多个梯度中选取可信任梯度包括：从所述多个梯度中选取偏差小于预设阈值的所述梯度作为可信任梯度。3.根据权利要求1所述的方法，其中，所述从所述多个梯度中选取可信任梯度包括：确定所述多个偏差结果的偏差由小到大的排名，从所述多个梯度中选取排名小于预设阈值的所述梯度作为可信任梯度。4.根据权利要求1所述的方法，其中，所述根据所述第二平均值更新所述联合训练模型的参数包括：将所述第二平均值作为所述联合训练模型的参数对应的梯度，使用所述基于梯度的优化算法更新所述联合训练模型的参数。5.一种模型联合训练的系统，所述系统包括：更新模块，用于：获取多个梯度，其中，所述多个梯度由多个联合训练的参与终端分别基于所述终端自身持有的样本数据进行模型联合训练得到；计算所述多个梯度的第一平均值，并且分别比较所述多个梯度与所述第一平均值，获取多个偏差结果；基于所述多个偏差结果，从所述多个梯度中选取可信任梯度，其中，所述多个梯度中除可信任梯度外的其他梯度为可疑梯度，所述可疑梯度不被用于本次更新联合训练模型的参数；计算所述多个可信任梯度的第二平均值，并且根据所述第二平均值更新所述联合训练模型的参数；所述样本数据为文本数据、语音数据或者图形数据。6.根据权利要求5所述的系统，其中，为了从所述多个梯度中选取可信任梯度，所述更新模块还用于：从所述多个梯度中选取偏差小于预设阈值的所述梯度作为可信任梯度。7.根据权利要求5所述的系统，其中，为了从所述多个梯度中选取可信任梯度，所述更新模块还用于：确定所述多个偏差结果的偏差由小到大的排名，从所述多个梯度中选取排名小于预设阈值的所述梯度作为可信任梯度。2CN113689006A权利要求书2/2页8.根据权利要求5所述的系统，其中，为了根据所述第二平均值更新所述联合训练模型的参数，所述更新模块还用于：将所述第二平均值作为所述联合训练模型的参数对应的梯度，使用所述基于梯度的优化算法更新所述联合训练模型的参数。9.一种模型联合训练的装置，其中，所述装置包括至少一个处理器以及至少一个存储器；所述至少一个存储器用于存储计算机指令；所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如权利要求1～4中任一项所述的方法。10.一种计算机可读存储介质，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行如权利要求1～4中任一项所述的方法。3CN113689006A说明书1/9页一种模型联合训练的方法和系统分案说明[0001]本申请是针对2020年04月23日提交的中国申请202010326265.6提出的分案。技术领域[0002]本说明书涉及机器学习领域，特别涉及一种模型联合训练的方法和系统。背景技术[0003]多方联合建模，即多个参与方在保护各自私有数据的

相关资料

一种模型联合训练的方法和系统.pdf

本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括：多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练，多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度；所述多个参与终端分别将所述各自的梯度发送给服务器；所述服务器从多个所述梯度中选取可信任梯度，并且根据选取的所述可信任梯度更新所述联合训练模型的参数；所述样本数据为文本数据、语音数据或者图形数据。

一种模型联合训练的方法和系统.pdf

一种模型联合训练的方法和系统.pdf

一种图模型和CTR模型的联合训练方法和装置.pdf

本发明实施例提供了一种图模型和CTR模型的联合训练方法和装置，其中，所述方法包括：获取用户行为序列数据；根据用户行为序列数据构建图模型；在图模型中查询用户行为序列数据中的每个项目信息的邻居节点；对每个项目信息和对应的邻居节点进行聚合处理得到每个项目信息的嵌入式向量；将嵌入式向量输入初始的CTR模型，根据监督损失函数训练CTR模型，直至CTR模型输出的损失值满足收敛条件为止。本发明实施例在图模型中查询项目信息的邻居节点，聚合得到嵌入式向量，避免了由于用户行为序列数据的行为稀疏、兴趣若泛而导致的较难预测CTR

2023-07-24

595KB

一种基于树模型的联合预测方法和系统.pdf

本说明书实施例提供一种基于树模型的联合预测方法及装置，该方法包括获取待预测对象的特征信息；获取可能到达的第一叶子节点以及可能到达的第二叶子节点；基于加密算法得到第一叶子节点加密列表和第二叶子节点加密列表；然后，将第一叶子节点加密列表和第二叶子节点加密列表进行再次加密，得到至少经过两次加密的目标叶子节点的值；基于第一加密算法将至少经过两次加密的目标叶子节点的值进行解密；然后，将解密结果发送给第二参与方。该方法采用密文传输，可以保护决策树模型隐私。

2023-05-25

611KB