一种模型训练方法、装置、计算机设备及可读存储介质.pdf
元容****少女
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
模型的训练方法、装置、计算设备及计算机可读存储介质.pdf
本说明书一个或多个实施例提供了一种模型的训练方法、装置、计算设备及计算机可读存储介质。在一种实施例中,一种模型的训练方法所训练的模型包括三个子模型,训练样本包括存储于存储空间中的有标签样本集和无标签样本集,在计算设备执行每一轮模型训练的过程中,针对每个子模型,利用有标签样本集和该子模型对应的伪标签样本集对该子模型进行训练,利用该子模型以外的其它两个子模型针对测试样本集的测试结果和针对无标签样本集的预测结果,更新该子模型的伪标签样本集,直到每个伪标签样本集中均不再有新的样本加入时,模型训练结束,得到最终的模
一种模型训练方法、装置、计算机设备及可读存储介质.pdf
本申请提供了一种模型训练方法、装置、计算机设备及可读存储介质,其中,将目标文本的分词结果的文本特征向量中的每个标签出现的第一概率输入至条件随机场损失函数中,以得到用于描述所述文本特征向量中各向量值之间差异程度的损失值;根据所述损失值,利用梯度回传算法对用于进行特征向量标签筛选的条件随机场模型进行训练;当训练次数满足预设阈值时,将训练后的条件随机场模型作为目标模型进行存储。采用上述方法,通过根据文本特征向量中各向量值之间的差异程度进行模型训练,有利于提高使用模型进行数据预测的准确度。
一种模型训练方法、装置、设备及可读存储介质.pdf
本申请公开了一种模型训练方法、装置、设备及可读存储介质。本申请设计了两个切比雪夫图卷积神经网络,一个基于顶点特征矩阵、邻接矩阵、标签矩阵进行有监督训练,另一个基于顶点特征矩阵、正逐点互信息矩阵和前一个网络在训练过程中的输出,进行无监督训练;当基于二者的损失值所确定的目的损失值符合预设收敛条件时,将两个切比雪夫图卷积神经网络组合为对偶顶点分类模型,从而训练得到了性能更佳的顶点分类模型。该方案能够充分发挥有监督训练和无监督训练各自的优势,提升了顶点分类模型的性能。相应地,本申请提供的一种模型训练装置、设备及可
一种模型训练方法、装置、计算设备及可读存储介质.pdf
本发明公开了一种模型训练方法,包括:训练第一翻译模型,第一翻译模型用于将第一源语言的文本翻译为第一目标语言;训练第二翻译模型,第二翻译模型用于将第二源语言的文本翻译为第二目标语言;利用第一源语言的词向量和第二源语言的词向量训练源语言转换组件;利用第一目标语言的词向量和第二目标语言的词向量训练目标语言转换组件;以及基于训练好的第一翻译模型、第二翻译模型、源语言转换组件和目标语言转换组件构建第三翻译模型,第三翻译模型用于将第二源语言的文本翻译为第二目标语言。本发明还公开了对应的模型训练装置、翻译装置、计算设备
模型训练方法、装置、计算机可读存储介质及计算机设备.pdf
本发明公开了一种模型训练方法、装置、计算机可读存储介质及计算机设备。其中,该方法包括:获取初始任务模型,其中,初始任务模型包括预训练模型以及一组前缀参数,前缀参数为初始任务模型的超参数,用于使初始任务模型适配不同任务;基于训练样本数据对初始任务模型进行训练,得到初始任务模型中与前缀参数对应的目标权重,其中,训练样本数据与目标任务对应;基于目标权重及初始任务模型,确定目标任务模型。本发明解决了添加前缀的预训练模型由于前缀过长或者过短导致模型出现过拟合或者欠拟合的技术问题。