模型训练方法、行为预测方法、装置及可读存储介质.pdf
一吃****海逸
亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
模型训练方法、行为预测方法、装置及可读存储介质.pdf
本申请提供了一种模型训练方法、行为预测方法、装置及可读存储介质,可利用不具行为标签的第一序列数据,对初始行为预测模型中的初始序列编码器进行无监督的预训练,得到预训练的序列编码器;利用预训练的序列编码器对具有行为标签的第二行为数据进行编码,得到样本用户的行为序列向量;利用初始行为预测模型中的初始门控网络,融合样本用户的画像特征向量以及行为序列向量,得到表征出画像特征以及行为特征的融合特征向量;通过融合特征向量,从画像特征和行为特征两个方面对初始行为预测模型进行训练,使得训练得到的目标行为预测模型在预测时,能
表征模型的训练方法、装置、可读存储介质及计算设备.pdf
本说明书实施例提供了表征模型的训练方法、装置、可读存储介质及计算设备。该方法包括:获取多个业务样本,任意业务样本包括业务事件的事件特征,并具有若干个业务分类任务各自对应的标签值;利用表征模型得到分别与多个业务样本一一对应的多个表征向量;对于多个业务样本中的目标业务样本,确定与该样本具有相同标签值的若干个第一样本、不同标签值的若干个第二样本;基于多个表征向量,计算各第一样本、各第二样本分别与该样本的相似度,得到对比学习结果;基于目标业务样本的对比学习结果,训练表征模型,使得表征模型学习相似的业务事件之间的关
模型训练方法、装置、电子设备及可读存储介质.pdf
本公开提供了一种模型训练方法、装置、电子设备及可读存储介质,涉及计算机技术领域,尤其涉及深度学习技术领域。具体实现方案为:获取N个训练语句,并将所述N个训练语句分别输入第一模型和第二模型,N为大于1的整数;获取所述第一模型输出的第一自注意力关系值和第二自注意力关系值,以及所述第二模型输出的第三自注意力关系值和第四自注意力关系值;获取所述第三自注意力关系值与所述第一自注意力关系值之间的第一相似度,以及所述第四自注意力关系值与所述第二自注意力关系值之间的第二相似度;基于所述第一相似度及所述第二相似度对所述第二
模型训练方法、装置、电子设备及可读存储介质.pdf
本公开提供了一种模型训练方法、装置、电子设备及可读存储介质,人工智能技术领域,尤其涉及机器学习、文本生成领域。具体实现方案为:将预测样本输入待训练模型的编码端,得到预测样本的特征向量。根据特征向量和预测样本对应的真实结果,将真实结果输入解码端,得到预测结果。根据真实结果预测结果和第一损失函数,计算得到第一损失值。根据第一损失值调整待训练模型的参数。由于在计算损失值时考虑了真实结果和预测结果,而非单纯的依赖于真实结果。使得根据损失值训练得到的模型能够同时参考真实结果和预测结果,保留更加多样的预测结果,提高了
预测模型的训练方法、装置、设备和存储介质.pdf
本发明提出一种预测模型的训练方法和装置、设备和存储介质,其中,方法包括:获取多个源域数据;其中,多个源域数据包括源标签;将多个源域数据输入神经网络进行训练,获取第一预测结果,根据第一预测结果和源标签调整神经网络的网络参数,以生成预训练模型;获取目标域数据,其中,目标域数据包括目标标签;将目标域数据输入预训练模型进行训练,获取第二预测结果,根据第二预测结果和目标标签调整预训练模型的网络参数,以生成目标域的预测模型。由此,通过源域的数据进行预训练获取预训练模型,并通过目标域的数据对预训练模型的参数进行微调,生