预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108399431A(43)申请公布日2018.08.14(21)申请号201810167276.7(22)申请日2018.02.28(71)申请人国信优易数据有限公司地址100071北京市丰台区南四环西路188号总部基地一区ABP大厦B座9层(72)发明人孙源良王亚松刘萌樊雨茂(74)专利代理机构北京超凡志成知识产权代理事务所(普通合伙)11371代理人梁香美(51)Int.Cl.G06K9/62(2006.01)G06N3/04(2006.01)权利要求书3页说明书15页附图4页(54)发明名称分类模型训练方法以及分类方法(57)摘要本申请提供一种分类模型训练方法以及分类方法,训练方法包括捕捉源域数据的源域共有特征向量和目标域数据的目标域共有特征向量并输入第一分类器,得到源域数据的第一分类结果和目标域数据的第一分类结果;捕捉源域数据的源域差异特征向量和目标域数据的目标域差异特征向量并输入第二分类器,得到源域数据的第二分类结果和目标域数据的第二分类结果;基于源域数据的第一分类结果、目标域数据的第二分类结果、源域数据的第一分类结果与源域数据的第二分类结果,对神经网络、共有特征捕捉层、第一分类器进行本轮训练。该方法能够同时将源域数据和目标域数据的相同特征和差异特征利用起来,训练得到的分类模型能够对目标域数据进行更加准确的分类。CN108399431ACN108399431A权利要求书1/3页1.一种分类模型训练方法,其特征在于,该方法包括:获取带有标签的源域数据以及不带标签的目标域数据;将所述源域数据以及所述目标域数据输入同一神经网络,为所述源域数据提取源域特征向量,并为所述目标域数据提取目标域特征向量;将所述源域特征向量和所述目标域特征向量输入共有特征捕捉层,并分别将捕捉的源域数据的源域共有特征向量和目标域数据的目标域共有特征向量输入第一分类器,得到源域数据的第一分类结果和目标域数据的第一分类结果;以及,将所述源域特征向量和所述目标域特征向量输入差异特征捕捉层,并分别将捕捉的源域数据的源域差异特征向量和目标域数据的目标域差异特征向量输入第二分类器,得到源域数据的第二分类结果和目标域数据的第二分类结果;基于所述目标域数据的第一分类结果与所述目标域数据的第二分类结果之间的比对结果,以及所述源域数据的第一分类结果与所述源域数据的第二分类结果之间的比对结果,对所述神经网络、所述共有特征捕捉层、以及所述第一分类器进行本轮训练;经过对所述神经网络、所述共有特征捕捉层、以及所述第一分类器进行多轮训练,得到分类模型。2.根据权利要求1所述的方法,其特征在于,基于所述目标域数据的第一分类结果与所述目标域数据的第二分类结果之间的比对结果,以及所述源域数据的第一分类结果与所述源域数据的第二分类结果之间的比对结果,对所述神经网络、所述共有特征捕捉层、以及所述第一分类器进行本轮训练,具体包括:将所述目标域数据的第一分类结果以及所述目标域数据的第二分类结果之间的差值确定为第一概率损失;将所述源域数据的第一分类结果以及所述源域数据的第二分类结果之间的差值确定为第二概率损失;并根据所述第一概率损失以及所述第二概率损失,对所述神经网络、所述共有特征捕捉层以及所述第一分类器进行本轮训练。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一概率损失以及所述第二概率损失,对所述神经网络、所述共有特征捕捉层以及所述第一分类器进行本轮训练,具体包括:执行如下第一比对操作,直至第一概率损失小于预设的第一概率损失阈值;所述第一比对操作包括:将所述第一概率损失与预设的第一概率损失阈值进行比对;若所述第一概率损失不小于预设的第一概率损失阈值,则对所述神经网络、所述共有特征捕捉层、所述差异特征捕捉层、所述第一分类器和所述第二分类器的参数进行调整;执行如下第二比对操作,直至第二概率损失大于预设的第二概率损失阈值;所述第二比对操作包括:将所述第二概率损失与预设的第二概率损失阈值进行比对;若所述第二概率损失不大于预设的第二概率损失阈值,则对所述神经网络、所述共有特征捕捉层、所述差异特征捕捉层、所述第一分类器和所述第二分类器的参数进行调整。4.根据权利要求1-3任一项所述的方法,其特征在于,将所述源域特征向量和所述目标2CN108399431A权利要求书2/3页域特征向量输入共有特征捕捉层,采用如下方式捕捉的源域数据的源域共有特征向量和目标域数据的目标域共有特征向量:将所述源域特征向量以及所述目标域特征向量输入至所述共有特征捕捉层,使用所述共有特征捕捉层提取所述源域共有特征向量和所述目标域共有特征向量;将所述源域共有特征向量和所述目标域共有特征向量进行梯度反向处理;将进行梯度反向处理的所述源域共有特征向量