对抗样本生成模型的训练方法及装置.pdf
是你****噩呀
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
对抗样本生成模型的训练方法及装置.pdf
本说明书实施例提供一种生成对抗样本的生成模型的训练方法和装置,该方法包括,首先获取原始样本构成的样本集,其中包括正常样本和风险样本;还获取风险检测模型及其对应的损失函数。针对样本集中各个原始样本,利用生成模型生成扰动变换,并将其叠加在对应原始样本上,得到各个原始样本对应的各个变换样本;利用风险检测模型确定各个变换样本的各个风险预测值;以正常样本对应的标签值为比对标签值,分别将各个风险预测值代入前述损失函数,得到各个变换样本的对抗损失;至少根据各个变换样本的对抗损失的综合确定总对抗损失;以最小化总对抗损失为
用于生成对抗文本的生成模型的训练方法及装置.pdf
本说明书实施例提供一种用于生成对抗文本的生成模型的训练方法及装置,在方法中,将具有分类标签的原始文本输入生成模型,生成对抗文本,该对抗文本用于模拟对目标分类模型的攻击。将对抗文本分别输入预先训练的目标分类模型和第二分类模型,得到第一分类结果和第二分类结果。第二分类模型用于基于文本的情感极性实现文本分类。根据第一分类结果和原始文本的分类标签,确定第一预测损失。根据第二分类结果和原始文本的分类标签,确定第二预测损失。根据原始文本与对抗文本的文本距离,确定第三预测损失。以最大化第一预测损失,且最小化第二预测损失
利用对抗生成网络生成对抗样本的方法及装置.pdf
本说明书实施例提供一种利用对抗生成网络生成对抗样本的方法,其中对抗生成网络包括:预先训练好的、用于针对业务对象执行N分类任务的分类器,用于生成对应于各类别真实样本的模拟样本的生成器,以及对应于N个类别的N个判别器,其中第i个判别器用于判别输入其中的样本是否属于第i个类别下的真实样本。在该方法中,可以实现对生成器和判别器的训练,进而利用其中训练好的生成器生成具有指定真实类别,但会被上述分类器预测为其他类别的对抗样本,同时,可以实现高效、快捷地生成大批量的优质对抗样本。
生成对抗样本的方法及装置.pdf
本说明书实施例提供一种生成对抗样本的方法和装置,其中方法包括,首先获取目标风险样本的原始样本特征以及风险检测模型。针对该目标风险样本,在预定特征空间中,确定预定数目T个基准方向;依次按照T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,其中风险检测模型针对该第一变换特征的预测值落入非风险样本对应的预定区间。然后,针对该第一变换特征,沿最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,该风险检测模型针对第二变换特征的预测值达到前
对抗样本的生成方法及装置.pdf
本说明书实施例提供一种对抗样本的生成方法,所述对抗样本对应m维样本向量,用于攻击特定模型;该方法包括:确定m维空间的n维子空间所对应的m*n维投影矩阵,再基于该m*n维投影矩阵,对当前对抗样本进行多轮迭代更新,其中任一轮迭代更新包括:先从该n维子空间中随机采样b个高斯向量;接着,利用该m*n维投影矩阵,将所述b个高斯向量映射回该m维空间,得到b个干扰向量;再将所述b个干扰向量分别添加至当前对抗样本对应的样本向量,得到b个查询样本,并查询该所述b个查询样本是否对所述特定模型攻击成功;再基于b个干扰向量和对应