排序模型训练方法及装置-豆柴文库

排序模型训练方法及装置.pdf

2023-05-25

10金币

2.7MB

29页

慧红****ad

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共29页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116028619A(43)申请公布日2023.04.28(21)申请号202211711526.1G06F40/194(2020.01)(22)申请日2022.12.29(66)本国优先权数据202111675158.52021.12.31CN(71)申请人北京金山数字娱乐科技有限公司地址100085北京市海淀区西二旗中路33号院5号楼11层002号(72)发明人李长亮白静姬子明(74)专利代理机构北京智信禾专利代理有限公司11637专利代理师张瑞(51)Int.Cl.G06F16/338(2019.01)G06F18/214(2023.01)G06F16/33(2019.01)权利要求书3页说明书20页附图5页(54)发明名称排序模型训练方法及装置(57)摘要本申请提供排序模型训练方法及装置，其中所述排序模型训练方法包括：获取待处理问题对应的正确答案以及多个候选答案；计算所述多个候选答案中各个候选答案与所述正确答案的答案匹配度；根据所述答案匹配度对所述多个候选答案进行划分获得正样本和负样本，并根据所述正样本和所述负样本构建样本集；利用所述样本集对答案排序模型进行训练，直至获得满足训练停止条件的目标答案排序模型。CN116028619ACN116028619A权利要求书1/3页1.一种排序模型训练方法，其特征在于，包括：获取待处理问题对应的正确答案以及多个候选答案；计算所述多个候选答案中各个候选答案与所述正确答案的答案匹配度；根据所述答案匹配度对所述多个候选答案进行划分获得正样本和负样本，并根据所述正样本和所述负样本构建样本集；利用所述样本集对答案排序模型进行训练，直至获得满足训练停止条件的目标答案排序模型。2.根据权利要求1所述的方法，其特征在于，所述获取待处理问题对应的多个候选答案，包括：将所述待处理问题输入至预设的阅读理解模块进行处理，获得所述阅读理解模块输出的所述多个候选答案；其中，所述阅读理解模块在多个候选文章中提取与所述待处理问题对应的所述多个候选答案并输出。3.根据权利要求1所述的方法，其特征在于，所述计算所述多个候选答案中各个候选答案与所述正确答案的答案匹配度，包括：计算所述多个候选答案中各个候选答案与所述正确答案的编辑操作次数，将所述编辑操作次数作为所述答案匹配度；或者，计算所述多个候选答案中各个候选答案与所述正确答案的字符相似度，将所述字符相似度作为所述答案匹配度。4.根据权利要求1所述的方法，其特征在于，所述根据所述答案匹配度对所述多个候选答案进行划分获得正样本和负样本，包括：将所述答案匹配度与预设的匹配度阈值进行比较；根据比较结果选择大于所述匹配度阈值的候选答案作为所述正样本，选择小于等于所述匹配度阈值的候选答案作为所述负样本。5.根据权利要求1‑4任意一项所述的方法，其特征在于，所述利用所述样本集对答案排序模型进行训练，直至获得满足训练停止条件的目标答案排序模型，包括：利用所述样本集对所述答案排序模型进行训练，获得满足训练停止条件的多个初始答案排序模型；按照预设的验证策略对每个初始答案排序模型进行检测，根据检测结果确定所述目标答案排序模型。6.根据权利要求5所述的方法，其特征在于，所述按照预设的验证策略对每个初始答案排序模型进行检测，根据检测结果确定所述目标答案排序模型，包括：在验证集中选择验证问题以及所述验证问题关联的验证信息，并基于所述验证问题和所述验证信息构建验证特征；将所述验证特征输入至每个初始答案排序模型进行处理，获得每个初始答案排序模型输出的验证答案排序结果；基于所述验证问题的验证答案对所述验证答案排序结果进行检测，根据检测结果确定所述目标答案排序模型。7.根据权利要求6所述的方法，其特征在于，所述根据检测结果确定所述目标答案排序2CN116028619A权利要求书2/3页模型，包括：根据检测结果在所述多个初始答案排序模型中选择设定数量的初始答案排序模型作为中间答案排序模型；对每个中间答案排序模型中的模型参数进行加权处理，获得目标模型参数；基于所述目标模型参数对任意一个中间答案排序模型进行调参，获得所述目标答案排序模型。8.一种排序模型训练装置，其特征在于，包括：获取模块，被配置为获取待处理问题对应的正确答案以及多个候选答案；计算模块，被配置为计算所述多个候选答案中各个候选答案与所述正确答案的答案匹配度；构建模块，被配置为根据所述答案匹配度对所述多个候选答案进行划分获得正样本和负样本，并根据所述正样本和所述负样本构建样本集；训练模块，被配置为利用所述样本集对答案排序模型进行训练，直至获得满足训练停止条件的目标答案排序模型。9.一种文本处理方法，其特征在于，包括：获取问题文本以及所述问题文本对应的候选答案；基于所述候选答案的关

相关资料

排序模型训练方法及装置.pdf

本申请提供排序模型训练方法及装置，其中所述排序模型训练方法包括：获取待处理问题对应的正确答案以及多个候选答案；计算所述多个候选答案中各个候选答案与所述正确答案的答案匹配度；根据所述答案匹配度对所述多个候选答案进行划分获得正样本和负样本，并根据所述正样本和所述负样本构建样本集；利用所述样本集对答案排序模型进行训练，直至获得满足训练停止条件的目标答案排序模型。

2023-05-25

2.7MB

排序模型训练方法和装置、物品排序方法和装置.pdf

本公开提供一种排序模型训练方法和装置、物品排序方法和装置。排序模型训练方法包括：将样本集合中的全部样本物品的相关信息输入特征提取模型，以分别得到每个样本物品的第一特征向量；将全部样本物品的第一特征向量进行融合以得到融合特征向量；将融合特征向量分别与每个样本物品的第一特征向量进行融合，以得到每个样本物品的第二特征向量；将全部样本物品的第二特征向量输入机器学习模型，以得到二维概率分布表；根据二维概率分布表得到输出矩阵；利用样本集合的标签矩阵，计算输出矩阵的每一行和每一列的交叉熵损失函数；利用输出矩阵的每一行和

2023-06-14

736KB

一种POI搜索排序模型训练方法、排序装置与方法及介质.pdf

本申请公开了一种基于深度学习的POI搜索排序模型训练方法、排序装置与方法及介质，属于地图导航搜索技术领域。该基于深度学习的POI搜索排序模型训练方法包括：获取搜索条目样本以及搜索条目样本对应的搜索结果样本；利用神经网络模型将搜索条目样本以及搜索结果样本进行向量表示，建立预训练向量样本库；以及通过将预训练向量样本库输入到语义匹配模型进行运算获取搜索条目样本与搜索结果样本之间的相似度，获得POI搜索排序模型，其中，将根据搜索结果样本的曝光点击率进行拟合得到的函数作为POI搜索排序模型的基准增益函数。本申请的应

2023-07-25

493KB

搜索推荐模型的训练方法、搜索结果排序的方法及装置.pdf

本申请公开了人工智能领域中的一种搜索推荐模型的训练方法、搜索结果排序的方法及装置，该训练方法包括：获取训练样本集合，该训练样本集合中包括样本用户行为组序列与样本遮盖用户行为组序列；通过以该训练样本集合为输入数据，以得到遮盖处理的该样本用户的响应操作的对象为训练目标对搜索推荐模型进行训练，得到训练后的搜索推荐模型，该搜索推荐模型用于在目标用户输入查询字段的情况下，预测该查询字段对应的搜索结果中的候选推荐对象的标签，该标签用于表示该目标用户对该候选推荐对象进行响应操作的概率。基于本申请的技术方案能够提高搜索推

2023-07-25

1.1MB

用于智能推荐的排序模型训练方法、智能推荐方法及装置.pdf

本公开提供了一种用于智能推荐的排序模型训练方法、智能推荐方法及装置，涉及数据处理、机器学习技术领域。方法包括：获取目标域的第一用户数据和第一资源数据，以及获取源域的第二用户数据和第二资源数据；根据第一用户数据、第一资源数据、第二用户数据和第二资源数据，确定隐式特征；基于隐式特征，训练排序模型，排序模型用于对目标域的用户进行资源推荐。本公开技术方案中，通过隐式特征的形式引入源域数据，可以避免直接将源域数据作为训练样本产生的“负迁移”现象，可以提升排序模型应用到资源推荐中的推荐效果。

2023-07-24

806KB