预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111241287A(43)申请公布日2020.06.05(21)申请号202010048326.7(22)申请日2020.01.16(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人任彦昆(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人张明周良玉(51)Int.Cl.G06F16/35(2019.01)权利要求书3页说明书9页附图4页(54)发明名称用于生成对抗文本的生成模型的训练方法及装置(57)摘要本说明书实施例提供一种用于生成对抗文本的生成模型的训练方法及装置,在方法中,将具有分类标签的原始文本输入生成模型,生成对抗文本,该对抗文本用于模拟对目标分类模型的攻击。将对抗文本分别输入预先训练的目标分类模型和第二分类模型,得到第一分类结果和第二分类结果。第二分类模型用于基于文本的情感极性实现文本分类。根据第一分类结果和原始文本的分类标签,确定第一预测损失。根据第二分类结果和原始文本的分类标签,确定第二预测损失。根据原始文本与对抗文本的文本距离,确定第三预测损失。以最大化第一预测损失,且最小化第二预测损失和第三预测损失为目标,训练生成模型。CN111241287ACN111241287A权利要求书1/3页1.一种用于生成对抗文本的生成模型的训练方法,所述方法包括:将具有分类标签的原始文本输入生成模型,以生成所述原始文本对应的对抗文本;所述对抗文本用于模拟对目标分类模型的攻击;将所述对抗文本输入预先训练的目标分类模型,输出第一分类结果;并且,将所述对抗文本输入预先训练的、基于文本的情感极性实现文本分类的第二分类模型,输出第二分类结果;根据所述第一分类结果和所述原始文本的分类标签,确定第一预测损失;根据所述第二分类结果和所述原始文本的分类标签,确定第二预测损失;至少根据所述原始文本与所述对抗文本之间的文本距离,确定第三预测损失;以最大化所述第一预测损失,且最小化所述第二预测损失和所述第三预测损失为目标,训练所述生成模型。2.根据权利要求1所述的方法,所述生成模型为变分自动编码器VAE;所述变分自动编码器VAE包括:编码器、解码器和采样单元;所述编码器,用于接收所述原始文本,输出所述原始文本对应的正态分布的均值和标准差;所述采样单元,用于在所述均值和标准差限定的正态分布中进行采样,并基于采样结果得到一个隐向量;所述解码器,用于对所述隐向量解码得到所述原始文本对应的对抗文本。3.根据权利要求2所述的方法,所述以最大化所述第一预测损失,且最小化所述第二预测损失和所述第三预测损失为目标,训练所述生成模型,包括:以最大化所述第一预测损失,且最小化所述第二预测损失和所述第三预测损失为目标,调整所述编码器以及所述解码器各自的参数。4.根据权利要求2所述的方法,所述确定第三预测损失,包括:基于所述原始文本对应的正态分布的均值和标准差,计算所述原始文本对应的KL散度值;根据所述原始文本与所述对抗文本之间的文本距离以及所述KL散度值,确定第三预测损失。5.根据权利要求2-4任一项所述的方法,在训练所述生成模型之后,还包括:随机采样服从标准正态分布的目标向量;将采样的目标向量作为训练后的所述生成模型的解码器的输入,通过输出得到新对抗文本。6.根据权利要求1所述的方法,所述以最大化所述第一预测损失,且最小化所述第二预测损失和所述第三预测损失为目标,训练所述生成模型,包括:基于所述第一预测损失、所述第二预测损失和所述第三预测损失各自对应的预定权重,对所述第一预测损失、所述第二预测损失和所述第三预测损失进行加权求和,得到综合损失,所述综合损失与所述第一预测损失负相关,且与所述第二预测损失和所述第三预测损失正相关;基于所述综合损失,训练所述生成模型。7.根据权利要求1所述的方法,所述原始文本包括用户评论内容或者广告内容。2CN111241287A权利要求书2/3页8.一种用于生成对抗文本的生成模型的训练装置,该装置包括:生成单元,用于将具有分类标签的原始文本输入生成模型,以生成所述原始文本对应的对抗文本;所述对抗文本用于模拟对目标分类模型的攻击;所述原始文本包括多个文本特征;输入输出单元,用于将所述对抗文本输入预先训练的目标分类模型,输出第一分类结果;并且,将所述对抗文本输入预先训练的、基于文本的情感极性实现文本分类的第二分类模型,输出第二分类结果;确定单元,用于根据所述第一分类结果和所述原始文本的分类标签,确定第一预测损失;根据所述第二分类结果和所述原始文本的分类标签,确定第二预测损失;至少根据所述原始文本与所述对抗文本之间的文本距离,确定第三预测损失;训练单元,用于以最大化所述第