一种获取对抗样本生成模型的方法和系统-豆柴文库

一种获取对抗样本生成模型的方法和系统.pdf

2023-05-25

10金币

590KB

17页

Jo****34

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共17页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111340143A(43)申请公布日2020.06.26(21)申请号202010409787.2(22)申请日2020.05.15(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人任彦昆(74)专利代理机构成都七星天知识产权代理有限公司51253代理人袁春晓(51)Int.Cl.G06K9/62(2006.01)权利要求书2页说明书10页附图4页(54)发明名称一种获取对抗样本生成模型的方法和系统(57)摘要本说明书实施例公开了一种获取对抗样本生成模型的方法和系统，所述方法包括：获取多个训练样本；对于多个训练样本的每一个进行以下处理，迭代更新对抗样本生成模型的参数，获取训练完成的对抗样本生成模型：输入对抗样本生成模型，以获取该训练样本相对应的构造样本；将所述构造样本输入到目标模型，以得到目标模型对所述构造样本的处理结果，并基于所述处理结果确定惩罚值；基于构造样本与其对应的训练样本的差异、以及惩罚值构造第一损失函数；所述第一损失函数与所述差异以及所述惩罚值均正相关；调节对抗样本生成模型的参数，以减小第一损失函数。CN111340143ACN111340143A权利要求书1/2页1.一种获取对抗样本生成模型的方法，其中，所述方法包括：获取多个训练样本；对于多个训练样本的每一个进行以下处理，迭代更新对抗样本生成模型的参数，获取训练完成的对抗样本生成模型：输入对抗样本生成模型，以获取该训练样本相对应的构造样本；将所述构造样本输入到目标模型，以得到目标模型对所述构造样本的处理结果，并基于所述处理结果确定惩罚值；基于构造样本与其对应的训练样本的差异、以及惩罚值构造第一损失函数；所述第一损失函数与所述差异以及所述惩罚值均正相关；调节对抗样本生成模型的参数，以减小第一损失函数。2.根据权利要求1所述的方法，其中，在所述对于多个训练样本的每一个进行以下处理，迭代更新对抗样本生成模型的参数，获取训练完成的对抗样本生成模型之前，还包括：利用多个训练样本对所述对抗样本生成模型进行预训练，以减小所述对抗样本生成模型输出的构造样本与其对应的训练样本之间的差异。3.根据权利要求1或2所述的方法，其中，所述训练样本为文本样本，所述对抗样本生成模型至少包括序列到序列模型；所述构造样本与其对应的训练样本的差异包括构造样本对应的向量表示与其对应的训练样本对应的向量表示之间的距离。4.根据权利要求1所述的方法，其中，所述基于所述处理结果确定惩罚值，包括：当目标模型对所述构造样本的处理结果与该目标模型对所述构造样本对应的训练样本的处理结果一致时，将所述惩罚值设为正值，否则将所述惩罚值设为负值。5.根据权利要求4所述的方法，其中，所述训练样本为文本样本，所述对抗样本生成模型至少包括序列到序列模型，所述序列到序列模型还输出构造样本为其对应的训练样本的对抗样本的概率；所述惩罚值的绝对值与所述概率正相关。6.一种对抗样本生成方法，其中，所述方法包括：获取原始样本；利用对抗样本生成模型处理所述原始样本，得到构造样本，并将所述构造样本确定为对应于原始样本的对抗样本，其中，所述对抗样本生成模型基于如权利要求1至5中任意一项所述的方法确定。7.一种获取对抗样本生成模型的系统，其中，所述系统包括：第一获取模块，用于获取多个训练样本；第一处理模块，用于对于多个训练样本的每一个进行以下处理，迭代更新对抗样本生成模型的参数，获取训练完成的对抗样本生成模型，包括：输入对抗样本生成模型，以获取该训练样本相对应的构造样本；将所述构造样本输入到目标模型，以得到目标模型对所述构造样本的处理结果，并基于所述处理结果确定惩罚值；基于构造样本与其对应的训练样本的差异、以及惩罚值构造第一损失函数；调节对抗样本生成模型的参数，以减小第一损失函数。2CN111340143A权利要求书2/2页8.根据权利要求7所述的系统，其中，所述系统还包括：预训练模块，用于利用多个训练样本对所述对抗样本生成模型进行预训练，以减小所述对抗样本生成模型输出的构造样本与其对应的训练样本之间的差异。9.根据权利要求7或8所述的系统，其中，所述训练样本为文本样本，所述对抗样本生成模型至少包括序列到序列模型；所述构造样本与其对应的训练样本的差异包括构造样本对应的向量表示与其对应的训练样本对应的向量表示之间的距离。10.根据权利要求7所述的系统，其中，为基于所述处理结果确定惩罚值，所述第一处理模块用于：当目标模型对所述构造样本的处理结果与该目标模型对所述构造样本对应的训练样本的处理结果一致时，将所述惩罚值设为正值，否则将所述惩罚值设为负值。11.根据权利要求10所述的系统，其中，所述训练

相关资料

一种获取对抗样本生成模型的方法和系统.pdf

本说明书实施例公开了一种获取对抗样本生成模型的方法和系统，所述方法包括：获取多个训练样本；对于多个训练样本的每一个进行以下处理，迭代更新对抗样本生成模型的参数，获取训练完成的对抗样本生成模型：输入对抗样本生成模型，以获取该训练样本相对应的构造样本；将所述构造样本输入到目标模型，以得到目标模型对所述构造样本的处理结果，并基于所述处理结果确定惩罚值；基于构造样本与其对应的训练样本的差异、以及惩罚值构造第一损失函数；所述第一损失函数与所述差异以及所述惩罚值均正相关；调节对抗样本生成模型的参数，以减小第一损失函数

2023-05-25

590KB

一种对抗攻击和生成对抗样本的方法.pdf

本说明书涉及人工智能领域，特别涉及一种对抗攻击和生成对抗样本的方法。其中，生成对抗样本的方法包括：基于初始样本及其标签、以及待攻击模型，进行一轮或多轮迭代，以构造对抗样本；其中的一轮迭代包括：获取当前轮的待调整样本；当当前轮为第一轮迭代时，所述待调整样本为所述初始样本，否则为前一轮的对抗样本；利用待攻击模型处理所述待调整样本，得到第一输出；基于所述第一输出和所述标签的差异、以及扰动系数，确定扰动数据；将所述扰动数据添加到所述待调整样本中，以获得当前轮的对抗样本；其中，所述扰动系数能够被调整，以使得对抗样本

2023-05-25

719KB

一种生成对抗样本的方法及系统.pdf

本说明书涉及人工智能领域，特别涉及一种生成对抗样本的方法及系统。该方法包括：基于初始样本和目标模型的多个替代模型，进行一轮或多轮迭代，以构造对抗样本；其中的一轮迭代包括：获取当前轮的待调整样本；当当前轮为第一轮迭代时，所述待调整样本为所述初始样本，否则为前一轮的对抗样本；基于待调整样本和多个替代模型，确定各替代模型的脆弱方向；所述脆弱方向与替代模型对待调整样本的预测结果与所述初始样本的标签之间的差异相对待调整样本的梯度信息相关；基于各替代模型的脆弱方向确定扰动数据；将所述扰动数据添加到所述待调整样本中，以

2023-05-25

563KB

一种对抗样本生成模型的构建方法及应用.pdf

本发明公开了一种对抗样本生成模型的构建方法及应用，属于人工智能安全领域，所构建的模型包括级联的扰动模块和奖励计算模块；通过最大化图像样本集中的所有图像样本所对应的奖励的累积值，对对抗样本生成模型进行训练；当对抗样本生成模型训练完成后，扰动模块输出的扰动后的图像即为基于图像样本生成的对抗样本；本发明构建了一个基于强化学习的对抗样本生成模型，通过在对抗样本生成模型的训练过程中不断优化扰动值，使得查询朝向所期望的目标进行，规避了大量的重复查询，计算效率较高。除此之外，本发明所构建的模型并不依赖目标模型的梯度来生

2023-07-21

521KB

一种对抗样本的生成方法及对抗样本的防御方法.pdf

本发明涉及一种对抗样本的生成方法包括:步骤1、对原始振动信号样本进行预处理,得到预处理后的样本x<base:Sub>t</base:Sub>;步骤2、将样本x<base:Sub>t</base:Sub>输入到目标网络f中,计算损失函数;t的初始值为0;步骤3、计算更新后的样本x<base:Sub>t+1</base:Sub>;步骤4、对更新后的样本x<base:Sub>t+1</base:Sub>进行度量,得到该样本x<base:Sub>t+1</base:Sub>的度量结果;步骤5、判断步骤4中度量结果

2023-06-06

697KB