对抗样本生成模型的训练方法及装置-豆柴文库

对抗样本生成模型的训练方法及装置.pdf

2023-05-25

10金币

695KB

17页

是你****噩呀

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共17页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113222480A(43)申请公布日2021.08.06(21)申请号202110656184.7(22)申请日2021.06.11(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人李辉王维强(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06Q10/06(2012.01)G06Q10/04(2012.01)G06N20/00(2019.01)G06K9/62(2006.01)权利要求书3页说明书9页附图4页(54)发明名称对抗样本生成模型的训练方法及装置(57)摘要本说明书实施例提供一种生成对抗样本的生成模型的训练方法和装置，该方法包括，首先获取原始样本构成的样本集，其中包括正常样本和风险样本；还获取风险检测模型及其对应的损失函数。针对样本集中各个原始样本，利用生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；利用风险检测模型确定各个变换样本的各个风险预测值；以正常样本对应的标签值为比对标签值，分别将各个风险预测值代入前述损失函数，得到各个变换样本的对抗损失；至少根据各个变换样本的对抗损失的综合确定总对抗损失；以最小化总对抗损失为目标，调整生成模型中的参数。CN113222480ACN113222480A权利要求书1/3页1.一种用于生成对抗样本的生成模型的训练方法，包括：获取原始样本构成的样本集，其中包括正常样本和风险样本；获取风险检测模型及其对应的损失函数，所述风险检测模型为生成模型所所针对的模型；针对所述样本集中各个原始样本，利用所述生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；利用所述风险检测模型确定所述各个变换样本的各个风险预测值；以正常样本对应的标签值为比对标签值，分别将所述各个风险预测值代入所述损失函数，得到各个变换样本的对抗损失；至少根据所述各个变换样本的对抗损失的综合确定总对抗损失；以最小化总对抗损失为目标，调整所述生成模型中的参数。2.根据权利要求1所述的方法，其中，所述各个变换样本包括，原始风险样本对应的变换风险样本，和原始正常样本对应的变换正常样本；至少根据所述各个变换样本的对抗损失的综合确定总对抗损失，包括：根据各个变换风险样本的对抗损失之和，确定第一损失项；根据各个变换正常样本的对抗损失之和，确定第二损失项；根据第一损失项和第二损失项的组合，确定所述总对抗损失。3.根据权利要求2所述的方法，其中，确定第一损失项，包括：根据各个变换风险样本的对抗损失之和，以及各个变换风险样本对应的扰动变换的大小度量值之和，确定所述第一损失项；确定第二损失项，包括：根据各个变换正常样本的对抗损失之和，以及各个变换正常样本对应的扰动变换的大小度量值之和，确定所述第二损失项。4.根据权利要求3所述的方法，其中，所述扰动变换的大小度量值为，所述扰动变换的二阶范数，或者二阶范数的平方。5.根据权利要求2或3所述的方法，其中，根据第一损失项和第二损失项的组合，确定所述总对抗损失，包括：根据所述第一损失项和第二损失项的加权求和，得到所述总对抗损失。。6.根据权利要求1所述的方法，其中，所述样本为以下之一：账号、交易、文本片段、用户操作。7.一种优化风险检测模型的方法，包括：获取原始样本构成的样本集，其中包括正常样本和风险样本；获取根据权利要求1的方法训练的生成模型；对于所述样本集中各个原始样本，利用所述生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；利用所述样本集中各个原始样本对应的原始标签和各个变换样本，更新风险检测模型。8.根据权利要求7所述的方法，其中，利用所述样本集中各个原始样本对应的原始标签2CN113222480A权利要求书2/3页和各个变换样本，更新风险检测模型，包括：利用损失函数，针对所述原始标签，确定风险检测模型针对包含所述各个变换样本的样本总集的总预测损失；以总预测损失最小化为目标，调整风险检测模型的模型参数。9.一种用于生成对抗样本的生成模型的训练装置，包括：第一获取单元，配置为获取原始样本构成的样本集，其中包括正常样本和风险样本；第二获取单元，配置为获取风险检测模型及其对应的损失函数，所述风险检测模型为生成模型所所针对的模型；变换单元，配置为针对所述样本集中各个原始样本，利用所述生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；预测单元，配置为利用所述风险检测模型确定所述各个变换样本的各个风险预测值；对抗损失确定单元，配置为以正常样本对应的标签值

相关资料

对抗样本生成模型的训练方法及装置.pdf

本说明书实施例提供一种生成对抗样本的生成模型的训练方法和装置，该方法包括，首先获取原始样本构成的样本集，其中包括正常样本和风险样本；还获取风险检测模型及其对应的损失函数。针对样本集中各个原始样本，利用生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；利用风险检测模型确定各个变换样本的各个风险预测值；以正常样本对应的标签值为比对标签值，分别将各个风险预测值代入前述损失函数，得到各个变换样本的对抗损失；至少根据各个变换样本的对抗损失的综合确定总对抗损失；以最小化总对抗损失为

2023-05-25

695KB

用于生成对抗文本的生成模型的训练方法及装置.pdf

本说明书实施例提供一种用于生成对抗文本的生成模型的训练方法及装置，在方法中，将具有分类标签的原始文本输入生成模型，生成对抗文本，该对抗文本用于模拟对目标分类模型的攻击。将对抗文本分别输入预先训练的目标分类模型和第二分类模型，得到第一分类结果和第二分类结果。第二分类模型用于基于文本的情感极性实现文本分类。根据第一分类结果和原始文本的分类标签，确定第一预测损失。根据第二分类结果和原始文本的分类标签，确定第二预测损失。根据原始文本与对抗文本的文本距离，确定第三预测损失。以最大化第一预测损失，且最小化第二预测损失

2023-05-25

639KB

利用对抗生成网络生成对抗样本的方法及装置.pdf

本说明书实施例提供一种利用对抗生成网络生成对抗样本的方法，其中对抗生成网络包括：预先训练好的、用于针对业务对象执行N分类任务的分类器，用于生成对应于各类别真实样本的模拟样本的生成器，以及对应于N个类别的N个判别器，其中第i个判别器用于判别输入其中的样本是否属于第i个类别下的真实样本。在该方法中，可以实现对生成器和判别器的训练，进而利用其中训练好的生成器生成具有指定真实类别，但会被上述分类器预测为其他类别的对抗样本，同时，可以实现高效、快捷地生成大批量的优质对抗样本。

2023-05-25

757KB

对抗样本生成方法、模型训练方法、处理方法及电子设备.pdf

本发明提供一种对抗样本生成方法，包括：基于空间注意力机制，对与当前轮迭代对应的图像特征数据进行第一处理，得到与当前轮迭代对应的图像的第一图像特征向量；对与当前轮迭代对应的图像的图像特征数据进行第二处理，得到与当前轮迭代对应的图像的第二图像特征向量；对由分散度函数和特征通道权重函数构成的函数组进行求导，基于求导后的函数组，根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量，得到与当前轮迭代对应的图像的梯度值，根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像，得到

2023-08-20

863KB

生成对抗样本的方法及装置.pdf

本说明书实施例提供一种生成对抗样本的方法和装置，其中方法包括，首先获取目标风险样本的原始样本特征以及风险检测模型。针对该目标风险样本，在预定特征空间中，确定预定数目T个基准方向；依次按照T个基准方向中的不同基准方向，以预设的第一步长，执行若干轮特征变换，直到得到第一变换特征，其中风险检测模型针对该第一变换特征的预测值落入非风险样本对应的预定区间。然后，针对该第一变换特征，沿最后一次特征变换方向的逆向，以依次增大的回退幅度执行若干次回退操作，直到得到第二变换特征，该风险检测模型针对第二变换特征的预测值达到前

2023-05-25

950KB