预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113723506A(43)申请公布日2021.11.30(21)申请号202111004317.9(22)申请日2021.08.30(71)申请人南京星环智能科技有限公司地址210004江苏省南京市建邺区江心洲贤坤路3号江岛智立方B座东侧3F(72)发明人唐剑飞张燕(74)专利代理机构北京品源专利代理有限公司11332代理人李彩玲(51)Int.Cl.G06K9/62(2006.01)权利要求书3页说明书15页附图8页(54)发明名称一种对抗样本的生成方法、设备及存储介质(57)摘要本发明公开了一种对抗样本的生成方法、设备及存储介质,该方法包括:获取与原始语料的目标词向量匹配的至少一个目标调整参数组,并根据目标词向量和每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;进而根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;将各中间对抗样本分别输入至目标识别模型中,得到与原始语料的模型识别结果不一致的中间对抗样本作为原始语料的目标对抗样本。本发明实施例中的技术方案,通过获取与原始语料对应的目标调整参数组,可以自动构建与原始语料对应的替换词集,提升对抗样本的生成效率。CN113723506ACN113723506A权利要求书1/3页1.一种对抗样本的生成方法,其特征在于,包括:获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。2.根据权利要求1所述的方法,其特征在于,获取与原始语料的目标词向量匹配的至少一个目标调整参数组,包括:将目标词向量与至少一个调整参数库的标准词向量进行相似性匹配,并根据匹配结果,判断是否存在与目标词向量对应的目标调整参数库;若是,根据目标调整参数库中包括的各调整参数组的排序权重,在所述目标调整参数库中获取设定数量的目标调整参数组;否则,将预设的至少一个标准调整参数组,确定为所述目标调整参数组。3.根据权利要求1所述的方法,其特征在于,目标调整参数组包括语义调整权重和外观调整权重;针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集,包括:根据各目标调整参数组中的语义调整权重和外观调整权重,确定待替换词集中的语义待替换词语数量;根据语义待替换词语数量,在所述待替换词集中进行随机采样,以获取对应数量的语义待替换词语,以及对应的外观待替换词语;根据粒子群优化算法,获取与各语义待替换词语语音相近的语义替换词语,以及与各外观待替换词语外观相近的外观替换词语,并根据语义替换词语和外观替换词语,生成替换词集。4.根据权利要求1所述的方法,其特征在于,根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本,包括:根据余弦相似度计算方法,获取各备选对抗样本的语义修改程度;并根据外观替换词语数量与备选对抗样本词语数量的比值,确定各备选对抗样本的外观修改程度;根据所述语义修改程度和所述外观修改程度,确定各备选对抗样本的差异度评分;将差异度评分小于或等于预设评分阈值的备选对抗样本,确定为中间对抗样本。5.根据权利要求1所述的方法,其特征在于,将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本之后,还包括:根据各目标对抗样本的差异度,在目标对抗样本中获取差异度最大的差异对抗样本,并确定差异对抗样本对应的目标调整参数组;根据目标词向量,与至少一个调整参数库的标准词向量进行一致性匹配,并根据一致性匹配结果,判断是否存在与目标词向量对应的调整参数库;若是,则将差异对抗样本对应的目标调整参数组,以及将根据目标调整参数组成功获2CN113723506A权利要求书2/3页取目标对抗样本的次数作为对应的排序权重,添加至目标词向量对应的调整参数库中;否则,新建目标词向量对应的,包括差异对抗样本对应的目标调整参数组的调整参数库。6.根据权利要求1所述的方法,其特征在于,在将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果之后,还包括:若未能成功获取与原始语料对应的目标对抗样本,则返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至满足结束迭代