模型训练方法、行为预测方法、装置及可读存储介质-豆柴文库

模型训练方法、行为预测方法、装置及可读存储介质.pdf

2023-07-21

10金币

1KB

30页

一吃****海逸

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共30页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114997323A(43)申请公布日2022.09.02(21)申请号202210693280.3(22)申请日2022.06.17(71)申请人网易(杭州)网络有限公司地址310052浙江省杭州市滨江区网商路599号网易大厦(72)发明人浦嘉澍张荣升吕唐杰范长杰胡志鹏(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463专利代理师高燕(51)Int.Cl.G06K9/62(2022.01)A63F13/79(2014.01)权利要求书3页说明书20页附图6页(54)发明名称模型训练方法、行为预测方法、装置及可读存储介质(57)摘要本申请提供了一种模型训练方法、行为预测方法、装置及可读存储介质，可利用不具行为标签的第一序列数据，对初始行为预测模型中的初始序列编码器进行无监督的预训练，得到预训练的序列编码器；利用预训练的序列编码器对具有行为标签的第二行为数据进行编码，得到样本用户的行为序列向量；利用初始行为预测模型中的初始门控网络，融合样本用户的画像特征向量以及行为序列向量，得到表征出画像特征以及行为特征的融合特征向量；通过融合特征向量，从画像特征和行为特征两个方面对初始行为预测模型进行训练，使得训练得到的目标行为预测模型在预测时，能够从画像和行为两个方面对用户的目标行为进行预测，以此，可以提高预测结果的准确性。CN114997323ACN114997323A权利要求书1/3页1.一种模型训练方法，其特征在于，所述模型训练方法包括：获取用于预训练初始行为预测模型中初始序列编码器的第一序列数据；其中，所述第一序列数据包括样本用户在游戏过程中所产生的多个第一行为数据；利用所述第一序列数据，采用无监督的训练方式对所述初始序列编码器进行预训练，得到预训练的序列编码器；通过所述预训练的序列编码器对所述样本用户的第二序列数据进行编码，得到所述样本用户的行为序列向量；其中，所述第二序列数据包括样本用户在游戏过程中所产生的多个第二行为数据；每个第二行为数据均具有对应的行为标签；所述行为标签表征所述样本用户在产生该第二行为数据后的预设时间段内所存在的目标行为；利用所述初始行为预测模型中的初始门控网络对所述样本用户的画像特征向量与所述样本用户的行为序列向量进行融合处理，得到所述样本用户的融合特征向量；利用所述融合特征向量以及每个第二行为数据对应的行为标签，对所述初始行为预测模型进行训练，得到训练好的目标行为预测模型；其中，所述目标行为预测模型包括目标门控网络、目标序列编码器以及行为预测子模型；所述行为预测子模型用于基于目标用户的融合特征向量对目标用户在预设时间段内能够产生的目标行为进行预测。2.根据权利要求1所述的模型训练方法，其特征在于，所述利用所述初始行为预测模型中的初始门控网络对所述样本用户的画像特征向量与所述样本用户的行为序列向量进行融合，得到所述样本用户的融合特征向量，包括：获取所述样本用户的样本画像特征；通过所述初始门控网络将所述样本画像特征映射至高维度向量空间，得到画像特征向量；利用所述初始门控网络融合所述画像特征向量和所述行为序列向量，得到融合特征向量。3.根据权利要求2所述的模型训练方法，其特征在于，所述初始门控网络包括重置门和更新门；所述利用所述初始门控网络融合所述画像特征向量和所述行为序列向量，得到融合特征向量，包括：通过所述重置门，从所述画像特征向量和所述行为序列向量中抽取出具有短期依赖关系的第一关联向量；通过所述更新门，从所述画像特征向量和所述行为序列向量中抽取出具有长期依赖关系的第二关联向量；基于所述第一关联向量和所述第二关联向量，确定所述融合特征向量。4.根据权利要求1所述的模型训练方法，其特征在于，所述通过所述预训练的序列编码器对所述样本用户的第二序列数据进行编码，得到所述样本用户的行为序列向量，包括：通过所述预训练的序列编码器对所述样本用户的第二序列数据进行均值池化处理，将所述第二序列数据映射为行为序列向量；其中，所述行为序列向量与所述画像特征向量具有相同的向量维度。5.根据权利要求1所述的模型训练方法，其特征在于，所述利用所述融合特征向量以及每个第二行为数据对应的行为标签，对所述初始行为预测模型进行训练，得到训练好的目标行为预测模型，包括：2CN114997323A权利要求书2/3页将所述融合特征向量作为所述初始行为预测模型的输入特征，以及将每个第二行为数据对应的行为标签作为所述初始行为预测模型的输出特征，对所述初始行为预测模型进行训练，确定所述初始行为预测模型的交叉熵损失；通过所述交叉熵损失分别调整所述初始行为预测模型中的所述初始门控网络、所述预训练的序列编码器以及行为预测子模型中所涉及的参数，直至所述交叉熵损失小于预设损失阈值

相关资料

模型训练方法、行为预测方法、装置及可读存储介质.pdf

本申请提供了一种模型训练方法、行为预测方法、装置及可读存储介质，可利用不具行为标签的第一序列数据，对初始行为预测模型中的初始序列编码器进行无监督的预训练，得到预训练的序列编码器；利用预训练的序列编码器对具有行为标签的第二行为数据进行编码，得到样本用户的行为序列向量；利用初始行为预测模型中的初始门控网络，融合样本用户的画像特征向量以及行为序列向量，得到表征出画像特征以及行为特征的融合特征向量；通过融合特征向量，从画像特征和行为特征两个方面对初始行为预测模型进行训练，使得训练得到的目标行为预测模型在预测时，能

2023-07-21

1KB

表征模型的训练方法、装置、可读存储介质及计算设备.pdf

本说明书实施例提供了表征模型的训练方法、装置、可读存储介质及计算设备。该方法包括：获取多个业务样本，任意业务样本包括业务事件的事件特征，并具有若干个业务分类任务各自对应的标签值；利用表征模型得到分别与多个业务样本一一对应的多个表征向量；对于多个业务样本中的目标业务样本，确定与该样本具有相同标签值的若干个第一样本、不同标签值的若干个第二样本；基于多个表征向量，计算各第一样本、各第二样本分别与该样本的相似度，得到对比学习结果；基于目标业务样本的对比学习结果，训练表征模型，使得表征模型学习相似的业务事件之间的关

2023-05-25

614KB

模型训练方法、装置、电子设备及可读存储介质.pdf

本公开提供了一种模型训练方法、装置、电子设备及可读存储介质,涉及计算机技术领域,尤其涉及深度学习技术领域。具体实现方案为:获取N个训练语句,并将所述N个训练语句分别输入第一模型和第二模型,N为大于1的整数;获取所述第一模型输出的第一自注意力关系值和第二自注意力关系值,以及所述第二模型输出的第三自注意力关系值和第四自注意力关系值;获取所述第三自注意力关系值与所述第一自注意力关系值之间的第一相似度,以及所述第四自注意力关系值与所述第二自注意力关系值之间的第二相似度;基于所述第一相似度及所述第二相似度对所述第二

2023-05-24

524KB

模型训练方法、装置、电子设备及可读存储介质.pdf

本公开提供了一种模型训练方法、装置、电子设备及可读存储介质，人工智能技术领域，尤其涉及机器学习、文本生成领域。具体实现方案为：将预测样本输入待训练模型的编码端，得到预测样本的特征向量。根据特征向量和预测样本对应的真实结果，将真实结果输入解码端，得到预测结果。根据真实结果预测结果和第一损失函数，计算得到第一损失值。根据第一损失值调整待训练模型的参数。由于在计算损失值时考虑了真实结果和预测结果，而非单纯的依赖于真实结果。使得根据损失值训练得到的模型能够同时参考真实结果和预测结果，保留更加多样的预测结果，提高了

2023-11-06

587KB

预测模型的训练方法、装置、设备和存储介质.pdf

本发明提出一种预测模型的训练方法和装置、设备和存储介质，其中，方法包括：获取多个源域数据；其中，多个源域数据包括源标签；将多个源域数据输入神经网络进行训练，获取第一预测结果，根据第一预测结果和源标签调整神经网络的网络参数，以生成预训练模型；获取目标域数据，其中，目标域数据包括目标标签；将目标域数据输入预训练模型进行训练，获取第二预测结果，根据第二预测结果和目标标签调整预训练模型的网络参数，以生成目标域的预测模型。由此，通过源域的数据进行预训练获取预训练模型，并通过目标域的数据对预训练模型的参数进行微调，生

2023-07-25

958KB