预测模型的训练方法、装置、设备和存储介质-豆柴文库

预测模型的训练方法、装置、设备和存储介质.pdf

2023-07-25

10金币

958KB

18页

努力****幻翠

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113762501A(43)申请公布日2021.12.07(21)申请号202110424701.8(22)申请日2021.04.20(71)申请人京东城市（北京）数字科技有限公司地址100086北京市海淀区知春路76号(写字楼)1号楼9层1-7-5号(72)发明人易修文段哲文(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人王萌(51)Int.Cl.G06N3/08(2006.01)G06Q10/04(2012.01)权利要求书3页说明书9页附图5页(54)发明名称预测模型的训练方法、装置、设备和存储介质(57)摘要本发明提出一种预测模型的训练方法和装置、设备和存储介质，其中，方法包括：获取多个源域数据；其中，多个源域数据包括源标签；将多个源域数据输入神经网络进行训练，获取第一预测结果，根据第一预测结果和源标签调整神经网络的网络参数，以生成预训练模型；获取目标域数据，其中，目标域数据包括目标标签；将目标域数据输入预训练模型进行训练，获取第二预测结果，根据第二预测结果和目标标签调整预训练模型的网络参数，以生成目标域的预测模型。由此，通过源域的数据进行预训练获取预训练模型，并通过目标域的数据对预训练模型的参数进行微调，生成预测模型以实现数据量很少的情况下也能够准确预测。CN113762501ACN113762501A权利要求书1/3页1.一种预测模型的训练方法，其特征在于，包括以下步骤：获取多个源域数据；其中，所述多个源域数据包括源标签；将所述多个源域数据输入神经网络进行训练，获取第一预测结果，根据所述第一预测结果和所述源标签调整所述神经网络的网络参数，以生成预训练模型；获取目标域数据，其中，所述目标域数据包括目标标签；将所述目标域数据输入所述预训练模型进行训练，获取第二预测结果，根据所述第二预测结果和所述目标标签调整所述预训练模型的网络参数，以生成目标域的预测模型。2.如权利要求1所述的方法，其特征在于，所述将所述多个源域数据输入神经网络进行训练，获取第一预测结果，包括：通过所述神经网络的特征提取网络对所述多个源域数据进行处理，以生成多个源域特征；通过所述神经网络的独立子网络和多个特有子网络分别对所述多个源域特征进行处理，以生成源域共享特征和多个源域特有特征；将所述源域共享特征和每个所述源域特有特征进行拼接后输入预测器，获取所述第一预测结果。3.如权利要求1所述的方法，其特征在于，所述将所述目标域数据输入所述预训练模型进行训练，获取第二预测结果，包括：通过所述预训练模型的特征提取网络对所述目标域数据进行处理，以生成目标域特征；通过所述预训练模型的目标域源域记忆网络、独立子网络和特有子网络分别对所述目标域特征进行处理，以生成目标域源域共享特征和目标域特有特征；将所述目标域源域相关特征、所述目标域共享特征和每个所述目标域特有特征进行拼接后输入预测器，获取所述第二预测结果。4.如权利要求1‑3任一项所述的方法，其特征在于，通过所述预训练模型的目标域源域记忆网络和特有子网络对所述目标域特征进行处理，以生成所述目标域源域共享特征，包括：所述目标域源域记忆网络对所述目标域特征进行处理，获取源域目标域历史相关特征；所述特有子网络的记忆网络对所述目标域特征进行检索，获取多个记忆表达特征；根据所述源域目标域历史相关特征和所述多个记忆表达特征进行计算，获取所述目标域源域共享特征。5.如权利要求4所述的方法，其特征在于，所述特有子网络的记忆网络对所述目标域特征进行检索，获取多个记忆表达特征，包括：对所述目标域特征与所述记忆网络中每个记忆单元进行相似度计算，获取多个相似度；根据每个所述相似度和已存储记忆特征矩阵进行计算，以生成所述多个记忆表达特征。6.一种预测模型的训练装置，其特征在于，包括：第一获取模块，用于获取多个源域数据；其中，所述多个源域数据包括源标签；2CN113762501A权利要求书2/3页第一训练模块，用于将所述多个源域数据输入神经网络进行训练，获取第一预测结果；第一生成模块，用于根据所述第一预测结果和所述源标签调整所述神经网络的网络参数，以生成预训练模型；第二获取模块，用于获取目标域数据，其中，所述目标域数据包括目标标签；第二训练模块，用于将所述目标域数据输入所述预训练模型进行训练，获取第二预测结果；第二生成模块，用于根据所述第二预测结果和所述目标标签调整所述预训练模型的网络参数，以生成目标域的预测模型。7.如权利要求6所述的装置，其特征在于，所述第一训练模块，具体用于：通过所述神经网络的特征提取网络对所述多个源域数据进行处理，以生成多个源域特征；通过所述神经网络的独立子网络和多个特有子网络分别对所述多个源域特征进行处理，以生成源

相关资料

预测模型的训练方法、装置、设备和存储介质.pdf

本发明提出一种预测模型的训练方法和装置、设备和存储介质，其中，方法包括：获取多个源域数据；其中，多个源域数据包括源标签；将多个源域数据输入神经网络进行训练，获取第一预测结果，根据第一预测结果和源标签调整神经网络的网络参数，以生成预训练模型；获取目标域数据，其中，目标域数据包括目标标签；将目标域数据输入预训练模型进行训练，获取第二预测结果，根据第二预测结果和目标标签调整预训练模型的网络参数，以生成目标域的预测模型。由此，通过源域的数据进行预训练获取预训练模型，并通过目标域的数据对预训练模型的参数进行微调，生

2023-07-25

958KB

模型训练方法、装置、设备及存储介质.pdf

本申请公开了模型训练方法和装置，具体实现方案为：获取用户行为序列样本集；将样本集中的用户行为序列输入至第一模型，得到第一预选条目的概率分布和第一目标条目，其中，第一模型为预先训练的教师模型；将样本集中的用户行为序列作为输入，将第二预选条目的概率分布和第二目标条目作为输出，对第二模型进行训练，得到用户行为预测模型，其中，第二模型为待训练的学生模型，用户行为预测模型的训练目标包括第一目标，第一目标为使第二目标条目对应向量和第一目标条目对应向量保持一致，第一模型和/或第二模型的训练任务包括辅助任务，辅助任务包括

2023-06-14

781KB

模型训练方法、装置、设备及存储介质.pdf

本公开实施例公开了一种模型训练方法、装置、设备及存储介质，其中，所述方法包括：损失函数缩放器创建接口基于缩放器构造参数，创建损失函数缩放器；在对深度学习模型进行的每一轮次混合精度训练的前向传播过程中，损失函数缩放器缩放接口基于所述损失函数缩放器，对所述深度学习模型在当前轮次混合精度训练中输出的损失值进行放大处理，得到放大后的所述损失值；在每一所述轮次混合精度训练的反向传播过程中，损失函数优化器迭代接口利用设定的优化器和所述损失函数缩放器，基于放大后的所述损失值，对所述深度学习模型中的网络参数进行更新，得到

2023-08-20

1MB

对象预测模型的训练方法、装置、电子设备及存储介质.pdf

本申请提出了一种对象预测模型的训练方法、装置、电子设备及存储介质，其中，方法包括：获取样本对象的描述信息和历史目标数量，其中，目标数量用于表征样本对象的热度；从描述信息中获取样本对象的图像的分类特征表示和文本信息的文本特征表示，以及历史目标数量的第一编码表示；根据分类特征表示、文本特征表示和第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。本申请中，通过融合图像信息和文本信息实现对象预测模型的训练，使得训练后的目标对象预测模型可以结合对象的图像和文本中的信息，实现对象的目标数量进行预测

2023-07-24

906KB

预测模型的训练方法、兴趣度预测方法、装置和存储介质.pdf

本申请提供一种预测模型的训练方法、兴趣度预测方法、装置及存储介质，针对同一个课程，获取K个用户的样本数据；每个用户的样本数据包括：该用户在M个特征维度中的每个维度上对所述课程进行学习的历史学习记录和表征该用户是否继续购买了所述课程的相关课程的记录；针对课程满意度的预测模型中的每棵待生成的决策树，从K个用户的样本数据中随机选取L个用户的样本数据；生成不同的决策树所用的样本数据不完全相同；生成不同的决策树所需的L相同或不同；利用L个用户的样本数据生成待生成的决策树；每棵决策树，用于根据输入的待预测用户对所述课

2023-11-26

609KB