预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111241280A(43)申请公布日2020.06.05(21)申请号202010015197.1(22)申请日2020.01.07(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人蒋亮温祖杰张家兴梁忠平(74)专利代理机构北京东方亿思知识产权代理有限责任公司11258代理人赵秀芹(51)Int.Cl.G06F16/35(2019.01)权利要求书4页说明书18页附图4页(54)发明名称文本分类模型的训练方法和文本分类方法(57)摘要本说明书实施例提供一种文本分类模型的训练方法和文本分类方法。在一个实施例中,一种文本分类模型的训练方法,包括:获取训练样本集;将训练样本集中文本样本分别输入公有特征提取器和与文本样本关联的私有特征提取器,得到文本样本的第一特征和第二特征;将文本样本的第一特征和第二特征分别输入任务判别器,得到文本样本的第一任务判别结果和第二任务判别结果;基于文本样本的第一特征和第二特征,利用与文本样本关联的私有特征提取器对应的分类器,得到文本样本的分类结果;判断是否满足预设训练停止条件;若不满足,调整文本分类模型的参数,并继续训练调整后的文本分类模型,直至满足预设训练停止条件,得到训练后的文本分类模型。CN111241280ACN111241280A权利要求书1/4页1.一种文本分类模型的训练方法,其中,所述文本分类模型包括公有特征提取器、至少两个私有特征提取器、任务判别器以及与各个私有特征提取器对应的分类器,所述方法包括:获取训练样本集;对所述训练样本集中多个文本样本中的各个所述文本样本,执行以下步骤:将所述文本样本分别输入所述公有特征提取器和与所述文本样本关联的私有特征提取器,得到所述文本样本的第一特征和所述文本样本的第二特征;将所述文本样本的第一特征和所述文本样本的第二特征分别输入所述任务判别器,得到所述文本样本的第一任务判别结果和第二任务判别结果,以对所述公有特征提取器和所述任务判别器进行对抗训练;基于所述文本样本的第一特征和所述文本样本的第二特征,利用与所述文本样本关联的私有特征提取器对应的分类器,得到所述文本样本的分类结果;基于各个所述文本样本的所述第一任务判别结果、所述第二任务判别结果和所述分类结果,判断是否满足预设训练停止条件;若不满足,基于各个所述文本样本的所述第一任务判别结果、所述第二任务判别结果和所述分类结果,调整所述文本分类模型的参数,并继续利用所述训练样本集训练调整后的文本分类模型,直至满足所述预设训练停止条件,得到训练后的文本分类模型。2.根据权利要求1所述的方法,其特征在于,所述基于各个所述文本样本的所述第一任务判别结果、所述第二任务判别结果和所述分类结果,判断是否满足预设训练停止条件,包括:基于各个所述文本样本的第一任务判别结果和各个所述文本样本的任务标签,计算第一损失函数值;对于各个所述分类器,根据所述分类器对应的私有特征提取器关联的各个第一文本样本的分类结果和所述各个第一文本样本的分类标签,计算第二损失函数值;对于各个所述私有特征提取器,根据所述私有特征提取器关联的各个第一文本样本的第二任务判别结果和所述各个第一文本样本的任务标签,计算第三损失函数值;判断所述第一损失函数值是否大于第一预设阈值,各个所述第二损失函数值是否小于第二预设阈值,且各个所述第三损失函数值是否小于第三预设阈值。3.根据权利要求1所述的方法,其特征在于,所述基于各个所述文本样本的所述第一任务判别结果、所述第二任务判别结果和所述分类结果,调整所述文本分类模型的参数,包括:基于各个所述文本样本的第一任务判别结果、各个所述文本样本的任务标签、各个所述文本样本的分类结果和各个所述文本样本的分类标签,调整所述公有特征提取器的参数;基于各个所述文本样本的第一任务判别结果、各个所述文本样本的第二任务判别结果和各个所述文本样本的任务标签,调整所述任务判别器的参数;对于各个私有特征提取器,基于所述私有特征提取器关联的各个第一文本样本的第二任务判别结果、所述各个第一文本样本的任务标签、所述各个第一文本样本的分类结果和所述各个第一文本样本的分类标签,调整所述私有特征提取器的参数;2CN111241280A权利要求书2/4页对于各个分类器,基于所述分类器对应的私有特征提取器关联的各个第一文本样本的分类结果和所述各个第一文本样本的分类标签,调整所述分类器的参数。4.根据权利要求3所述的方法,其特征在于,所述基于各个所述文本样本的第一任务判别结果、各个所述文本样本的任务标签、各个所述文本样本的分类结果和各个所述文本样本的分类标签,调整所述公有特征提取器的参数,包括:基于各个所述文本样