模型训练方法、成员探测装置的训练方法及其系统-豆柴文库

模型训练方法、成员探测装置的训练方法及其系统.pdf

2023-05-25

10金币

506KB

16页

朋兴****en

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111079946A(43)申请公布日2020.04.28(21)申请号201911333307.2(22)申请日2019.12.20(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人周俊(74)专利代理机构成都七星天知识产权代理有限公司51253代理人袁春晓(51)Int.Cl.G06N20/00(2019.01)G06F21/60(2013.01)权利要求书2页说明书10页附图3页(54)发明名称模型训练方法、成员探测装置的训练方法及其系统(57)摘要本说明书中的实施例提供了模型训练方法、成员探测装置的训练方法及其系统，以防范成员攻击造成的数据隐私泄露。其中，成员探测装置可以基于特征数据、标签数据和模型的预测结果评估攻击者基于这些数据成功探测出该特征数据是否属于模型训练集的概率。进而，模型训练系统可以通过调节所训练模型的参数和/或结构来降低该概率。CN111079946ACN111079946A权利要求书1/2页1.一种保护数据隐私的模型训练方法，其中，包括：基于训练集训练模型；对于所述训练集中的任一训练样本，获取成员探测装置基于该训练样本的特征数据、标签数据和所述模型基于该训练样本的输出结果得到的输出值，所述输出值反映基于所述输出结果正确推断出该训练样本属于所述训练集的概率；调节所述模型的参数和/或结构，以降低所述输出值。2.根据权利要求1所述的方法，其中，所述训练样本包括实体的隐私数据，所述隐私数据包括文本数据、图像数据、声音数据中的一种或多种。3.根据权利要求1所述的方法，其中，所述调节所述模型的参数和/或结构，包括：使所述模型的一个或多个节点在给定输入的条件下对应的输出具有不确定性。4.根据权利要求3所述的方法，其中，所述使所述模型的一个或多个节点在给定输入的条件下对应的输出具有不确定性，包括：在所述一个或多个节点的输出中添加噪声。5.根据权利要求1所述的方法，其中，所述调节所述模型的参数和/或结构，包括：屏蔽所述模型中的一个或多个节点。6.根据权利要求1所述的方法，其中，还包括：对于模型的训练集中的任一训练样本：获取该训练样本的特征数据、标签数据和所述模型基于该训练样本的输出结果，作为训练输入数据；获取反映所述模型对于该训练样本的预测性能的信息值，作为训练输出参考数据；利用基于训练集中各训练样本确定的训练输入数据和训练输出参考数据训练所述成员探测装置。7.一种保护数据隐私的模型训练系统，其中，包括：模型训练模块，用于基于训练集训练模型；第一获取模块，用于对于所述训练集中的任一训练样本，获取成员探测装置基于该训练样本的特征数据、标签数据和所述模型基于该训练样本的输出结果得到的输出值，所述输出值反映基于所述输出结果正确推断出该训练样本属于所述训练集的概率；调节模块，用于调节所述模型的参数和/或结构，以降低所述输出值。8.根据权利要求7所述的系统，其中，所述训练样本包括实体的隐私数据，所述隐私数据包括文本数据、图像数据、声音数据中的一种或多种。9.根据权利要求7所述的系统，其中，所述调节模块进一步用于使所述模型的一个或多个节点在给定输入的条件下对应的输出具有不确定性。10.根据权利要求9所述的系统，其中，所述调节模块进一步用于在所述一个或多个节点的输出中添加噪声。11.根据权利要求7所述的系统，其中，所述调节模块进一步用于屏蔽所述模型中的一个或多个节点。12.根据权利要求7所述的系统，其中，还包括成员探测装置训练模块，所述成员探测装置训练模块用于：对于模型的训练集中的任一训练样本：2CN111079946A权利要求书2/2页获取该训练样本的特征数据、标签数据和所述模型基于该训练样本的输出结果，作为训练输入数据；获取反映所述模型对于该训练样本的预测性能的信息值，作为训练输出参考数据；利用基于训练集中各训练样本确定的训练输入数据和训练输出参考数据训练所述成员探测装置。13.一种保护数据隐私的模型训练装置，其中，包括至少一个处理器和至少一个存储设备，所述存储设备用于存储指令，当至少一个处理器执行指令时，实现如权利要求1～6中任一项所述的方法。14.一种成员探测装置的训练方法，其中，包括：对于模型的训练集中的任一训练样本：获取该训练样本的特征数据、标签数据和所述模型基于该训练样本的输出结果，作为训练输入数据；获取反映所述模型对于该训练样本的预测性能的信息值，作为训练输出参考数据；利用基于训练集中各训练样本确定的训练输入数据和训练输出参考数据训练所述成员探测装置。15.根据权利要求14所述的方法，其中，所述训练样本包括实体的隐私数据，所述隐私数据包括文本数据、图像数据、声音数据

相关资料

模型训练方法、成员探测装置的训练方法及其系统.pdf

本说明书中的实施例提供了模型训练方法、成员探测装置的训练方法及其系统，以防范成员攻击造成的数据隐私泄露。其中，成员探测装置可以基于特征数据、标签数据和模型的预测结果评估攻击者基于这些数据成功探测出该特征数据是否属于模型训练集的概率。进而，模型训练系统可以通过调节所训练模型的参数和/或结构来降低该概率。

2023-05-25

506KB

模型评价方法和装置、模型评价系统及其训练方法和装置.pdf

本申请提供模型评价方法和装置、模型评价系统及其训练方法和装置，其中，模型评价方法包括：将任务输入特征分别输入至少两个任务模型，得到每个任务模型的任务输出特征和任务输出特征对应的置信度；将任务输入特征对应的至少两个任务模型的任务输出特征和任务输出特征对应的置信度输入参数搜索模型，以使参数搜索模型根据每个任务模型的任务输出特征对应的置信度以及参数搜索模型的权重参数，得到每个任务模型的置信权重，并根据每个任务模型的置信权重得到每个任务模型的评价值，其中，参数搜索模型具有最优的权重参数。从而在同一个任务模型对不同

2023-12-04

1.1MB

业务模型训练方法、装置及系统.pdf

本说明书实施例提供用于经由多个成员设备训练业务模型的方法、装置及系统。第一和第二成员设备分别具有第一和第二数据，第一和第二数据按照垂直切分方式组成用于模型训练的训练样本集，并且第一成员设备具有训练样本的标签数据。在每次循环时，各个成员设备协同，使用当前训练样本训练出当前业务模型并得到当前训练样本的模型预测结果。在第一成员设备处根据模型预测结果确定出当前训练样本中的预测误差最大的第一训练样本，并将第一训练样本的样本标识发送给各个第二成员设备。各个成员设备协同来从未使用训练样本中选择出与第一训练样本相似的第二

2023-05-25

954KB

模型训练方法、装置、设备及系统.pdf

本说明书实施例提供了一种模型训练方法、装置、设备及系统，其中方法包括：图像采集设备采集待识别用户的生物特征图像，基于学生模型对生物特征图像进行识别处理，得到识别结果；若根据识别结果确定生物特征图像满足预设的样本累积条件，则将生物特征图像确定为第一目标样本并保存；确定是否满足学生模型的自蒸馏训练条件，若是，则基于融合指导和一对多指导的自蒸馏训练方式，利用保存的第一目标样本对学生模型进行自蒸馏训练处理，得到更新后的学生模型；其中，学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得。

2023-05-25

1.5MB

业务模型训练方法、装置及系统.pdf

本说明书实施例提供用于经由第一成员设备和至少两个第二成员设备训练业务模型的方法、装置和系统。各个第二成员设备具有本地业务模型和本地样本数据，并且所具有的本地样本数据是非独立同分布数据。各个第二成员设备将本地样本数据分布信息提供给第一成员设备。第一成员设备根据各个第二成员设备的本地样本数据分布信息确定整体样本数据概率分布，并发送给各个第二成员设备。各个第二成员设备根据整体样本数据概率分布和超参数，从本地样本数据中确定各类样本数据的扩充样本数据，所述扩充样本数据用于扩充业务模型的训练样本数据。

2023-05-25

865KB