预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113722450A(43)申请公布日2021.11.30(21)申请号202110010192.4G06Q30/02(2012.01)(22)申请日2021.01.05G06Q30/06(2012.01)G06N3/04(2006.01)(71)申请人北京沃东天骏信息技术有限公司G06N20/10(2019.01)地址101116北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人李旻刘石竹王钦周辉侯会满王自珍(74)专利代理机构北京唯智勤实知识产权代理事务所(普通合伙)11557代理人陈佳(51)Int.Cl.G06F16/332(2019.01)G06F16/953(2019.01)权利要求书3页说明书19页附图5页(54)发明名称信息检索模型训练方法、信息检索模型训练方法、装置(57)摘要本公开的实施例公开了信息检索模型训练方法、信息检索模型训练、装置、设备和介质。该方法的一具体实施方式包括:获取与目标用户对应的目标查询信息、训练文本集和未点击文本集;将训练文本集中每个训练文本和未点击文本集中每个未点击文本分别与目标查询信息进行组合,以生成训练文本对和未点击文本对,得到训练文本对集和未点击文本对集;获取预先建立的生成式对抗网络;对生成网络和判别网络进行训练,将训练后的判别网络确定为第一信息检索模型,其中,判别网络在训练过程中对生成网络采样出的未点击文本对和训练文本对集加入对应的虚拟对抗性扰动。该实施方式得到的信息检索模型可以快捷、有效的对与用户查询相关的文档进行相关性确定。CN113722450ACN113722450A权利要求书1/3页1.一种信息检索模型训练方法,包括:获取与目标用户对应的目标查询信息、训练文本集和未点击文本集,其中,所述训练文本集包括与所述目标查询信息存在关联关系的文本集和与所述目标查询信息无关联关系的文件集,所述未点击文本集为所述目标用户未点击的文件集;将所述训练文本集中每个训练文本和所述未点击文本集中每个未点击文本分别与所述目标查询信息进行组合,以生成训练文本对和未点击文本对,得到训练文本对集和未点击文本对集;获取预先建立的生成式对抗网络,其中,所述生成式对抗网络包括生成网络和判别网络,所述生成网络用于从所述未点击文本对集中采样出所述判别网络不易识别出所述关联关系且不存在所述关联关系的文本对,所述判别网络用于确定所述生成网络采样出来的文本对是否存在所述关联关系;将所述未点击文本对集作为所述生成网络的输入,将所述生成网络采样出的未点击文本对、所述训练文本对集作为所述判别网络的输入,对所述生成网络和所述判别网络进行训练,将训练后的判别网络确定为第一信息检索模型,其中,所述判别网络在训练过程中对所述生成网络采样出的未点击文本对和所述训练文本对集加入对应的虚拟对抗性扰动。2.根据权利要求1所述的方法,其中,所述对所述生成网络和所述判别网络进行训练,将训练后的判别网络确定为第一信息检索模型,包括:执行如下训练步骤:固定所述生成网络的参数,将所述未点击文本对集作为所述生成网络的输入,将所述生成网络采样出的未点击文本对、所述训练文本对集作为所述判别网络的输入,利用机器学习方法对所述判别网络进行训练;固定训练后的判别网络的参数,将所述未点击文本对集作为所述生成网络的输入,利用强化学习方法对所述生成网络进行训练;确定训练后的判别网络输出的判别结果的准确率;响应于确定所述准确率大于预定阈值,将最近一次训练的判别网络确定为所述第一信息检索模型。3.根据权利要求2所述的方法,其中,所述方法还包括:响应于确定所述准确率小于或等于所述预定阈值,使用最近一次训练的生成网络和判别网络重新执行所述训练步骤。4.根据权利要求1所述的方法,其中,所述第一信息检索模型包括预先确定的算分函数。5.根据权利要求4所述的方法,其中,所述算分函数用于对所述输入至第一信息检索模型的文本集中的每个文本进行打分或对所述文本集中各个文本进行排序。6.根据权利要求5所述的方法,其中,所述输入至第一信息检索模型的文本集包括以下之一:问题与回答的文本集、网络搜索文本集、产品推荐文本集,其中,响应于所述文本集为所述问题与回答的文本集,所述第一信息检索模型应用为问答模型,响应于所述文本集为所述网络搜索文本集,所述第一信息检索模型应用为网络搜索模型,响应于所述文本集为所述产品推荐文本集,所述第一信息检索模型应用为产品推荐模型。7.根据权利要求6所述的方法,其中,所述问答模型存在对应的预先确定的第一算分函2CN113722450A权利要求书2/3页数,所述网络搜索模型存在对应的预先确定的第二算分函数,所述产品推荐模型存在对应的