预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114298321A(43)申请公布日2022.04.08(21)申请号202111607572.2(22)申请日2021.12.24(71)申请人卫盈联信息技术(深圳)有限公司地址518000广东省深圳市前海深港合作区南山街道桂湾五路128号前海深港基金小镇A4栋101(72)发明人张铁钢许文彬(74)专利代理机构深圳市沃德知识产权代理事务所(普通合伙)44347代理人高杰郭梦霞(51)Int.Cl.G06N20/00(2019.01)权利要求书3页说明书12页附图2页(54)发明名称联合建模方法、装置、电子设备及存储介质(57)摘要本发明涉及数据处理领域,揭露一种联合建模方法,包括:对第一样本集及每个第二样本集分别执行公有样本ID识别处理,基于识别结果将第一样本集拆分为每个第二参与方对应的第一子样本集;基于每个第一子样本集对应的预设模型的初始参数及对应的第二参与方的第二样本集,计算每个第一子样本集对应的梯度值;基于梯度值确定每个第一子样本集对应的第一参数;接收每个第二参与方发送的第二参数及其它第一参与方发送的第三参数;当判断预设模型收敛时,基于第一参数、第二参数及第三参数确定目标参数,并将目标参数发送给其它参与方,完成联合建模。本发明还提供一种联合建模装置、电子设备及存储介质。本发明提高了联合模型的精确度。CN114298321ACN114298321A权利要求书1/3页1.一种联合建模方法,应用于联合建模系统中任意一个第一参与方,所述联合建模系统包括通信连接的多个第一参与方及多个第二参与方,其特征在于,各个第一参与方与每个第二参与方之间包含相同的样本对象及不同的样本特征,各个第二参与方之间包含相同的样本特征及不同的样本对象,所述方法包括:接收所述联合建模系统中每个第二参与方发送的同态加密密钥对中的公钥,基于所述公钥对本地存储的不含标签信息的第一样本集及每个第二参与方的携带标签信息的第二样本集分别执行公有样本ID识别处理,基于公有样本ID识别结果将所述第一样本集拆分为每个第二参与方对应的第一子样本集;获取每个第一子样本集对应的预设模型的初始参数,基于所述公钥、初始参数及对应的第二参与方的第二样本集,计算每个第一子样本集对应的梯度值;基于所述梯度值对每个第一子样本集对应的预设模型执行参数更新处理,得到每个第一子样本集对应的第一参数;接收每个第二参与方发送的其第二样本集对应的采用安全聚合算法处理后的第二参数及损失值,并接收其它第一参与方发送的其每个子样本集对应的采用安全聚合算法处理后的第三参数;基于所述损失值判断所述预设模型是否收敛,当判断是时,基于所述第一参数、第二参数及第三参数确定目标参数,并将所述目标参数分别发送给所述联合建模系统中其它参与方,完成联合建模。2.如权利要求1所述的联合建模方法,其特征在于,所述基于所述公钥对本地存储的不含标签信息的第一样本集及每个第二参与方的携带标签信息的第二样本集分别执行公有样本ID识别处理,包括:选择一个第二参与方,计算所述第一样本集中各个样本ID的第一哈希值,采用所述选择的第二参与方对应的同态加密密钥对中的公钥加密所述第一哈希值,得到第一密文,并建立第一密文与样本ID之间的映射关系;接收选择的第二参与方发送的第二密文,所述第二密文是选择的第二参与方采用同一同态加密密钥对中的公钥加密其第二样本集中各个样本ID的第二哈希值得到的;计算第一密文与第二密文的交集,得到公有样本ID密文,基于所述映射关系确定所述公有样本ID密文的明文数据。3.如权利要求1所述的联合建模方法,其特征在于,所述基于所述公钥、初始参数及对应的第二参与方的第二样本集,计算每个第一子样本集对应的梯度值,包括:根据第一子样本集的数量开启多个进程,每个进程根据对应的第一子样本集及其初始参数,计算每个第一子样本集对应的第一特征矩阵;将所述第一特征矩阵发送给对应的第二参与方,接收对应的第二参与方发送的采用所述公钥加密后的误差值,所述误差值是对应的第二参与方根据其第二样本集的第二特征矩阵及所述第一特征矩阵计算得到的;将加密后的误差值代入梯度值计算公式,得到每个第一子样本集对应的加密后的梯度值,将所述加密后的梯度值发送给对应的第二参与方,以获取所述加密后的梯度值的明文数据。4.如权利要求3所述的联合建模方法,其特征在于,所述对应的第二参与方根据其第二2CN114298321A权利要求书2/3页样本集的第二特征矩阵及所述第一特征矩阵计算误差值的过程,包括:对应的第二参与方基于其第二样本集的第二特征矩阵及所述第一特征矩阵计算其第二样本集的特征值;将所述特征值输入预设模型,得到其第二样本集的预测值;基于所述标签信息确定其第二样本集的真实值,基于所述真实值及所述预