机器翻译模型训练方法及其装置、设备、介质、产品.pdf
猫巷****忠娟
亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
机器翻译模型训练方法及其装置、设备、介质、产品.pdf
本申请涉及一种机器翻译模型训练方法及其装置、设备、介质、产品,所述方法包括:获取数据集,其中包括多个平行语料;构造机器翻译模型的多个变体模型,确定其中单个变体模型作为学生模型,余者作为教师模型;采用所述数据集中的平行语料将各个所述教师模型训练至收敛状态;构造知识蒸馏网络,采用所述数据集中的平行语料输入所述知识蒸馏网络实施训练,通过多个所述教师模型联合监督所述学生模型训练至收敛状态。本申请基于机器翻译模型,预先制备多个具有不同优势推理能力的变体模型作为教师模型,然后通过知识蒸馏的方式将多个教师模型的优势推理
神经网络模型训练方法及其装置、设备、介质、产品.pdf
本申请涉及一种神经网络模型训练方法及其装置、设备、介质、产品,所述方法包括:确定待监测的性能指标及训练轮数,根据训练轮数随机生成容忍轮数,使容忍轮数成为关联于所述训练轮数的随机值;按照训练轮数对神经网络模型执行多轮训练,在每轮训练中将神经网络模型的实例训练至收敛,获得相应的已收敛实例;判断每轮训练所得的已收敛实例的性能指标是否低于历轮获得的已收敛实例的性能指标中的最高性能指标,当低于最高性能指标时,统计持续低于最高性能指标的持续总轮数;当持续总轮数达到所述容忍轮数时,终止训练,确定获得最高性能指标的已收敛
模型训练方法、机器翻译方法、装置、设备及存储介质.pdf
本公开实施例公开了一种模型训练方法、机器翻译方法、装置、设备及存储介质。模型训练方法包括:通过神经网络剪枝技术确定第一翻译模型中各参数对第一领域翻译结果的影响度,得到第一参数和第二参数;利用第一领域的第一语料训练第一参数,得到第二翻译模型,第二参数不变;利用目标领域的语料训练第二翻译模型的目标参数,得到目标翻译模型,其他参数不变,目标参数为部分或全部第二参数。该方案利用第一领域的语料训练第一参数,训练结束后,利用目标域的语料训练第二参数,最终得到的模型既保留了第一领域的信息又增加了目标领域的信息,提高了目
机器翻译模型的训练方法、装置、电子设备及存储介质.pdf
本发明实施例公开了一种机器翻译模型的训练方法、装置、电子设备及存储介质。其中,机器翻译模型包括:编码器模块、解码器模块以及对抗生成模块;方法包括:获取训练样本集,并确定与训练样本集对应的第一训练样本集以及第二训练样本集;依次将训练样本集输入至编码器模块以及解码器模块,得到参考编码器权重参数以及参考解码器权重参数;依次将第一训练样本集以及第二训练样本集输入至编码器模块以及对抗生成模块,得到目标编码器权重参数;根据目标编码器权重参数对参考解码器权重参数进行更新,并在满足训练停止条件时,得到目标机器翻译模型。本
模型训练方法、装置、设备、介质及程序产品.pdf
本公开提供模型训练方法、装置、设备、介质及程序产品,涉及计算机技术领域,尤其涉及车联网和智能座舱技术领域。具体实现方案为:获取模糊图像的标注结果;所述模糊图像通过对原始图像进行模糊处理得到;获取原始图像;确定所述标注结果和所述原始图像之间的关联关系;基于所述标注结果、所述原始图像和所述关联关系,对目标网络模型进行训练。本公开实施例的技术方案可以避免图像标注过程中隐私数据的泄露。