语言模型的训练方法及装置.pdf
努力****骞北
亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语言模型的训练方法及装置.pdf
提供一种语言模型的训练方法及装置。该语言模型的训练方法包括:接收输入的训练数据,其中,训练数据包括给定词和所述给定词的上下文;基于所述给定词和所述给定词的上下文,生成训练数据在目标语言中的词的上下文相关向量的代理,并且基于所述给定词的上下文,生成训练数据在源语言中的上下文相关的词向量;基于词的上下文相关向量的代理和上下文相关的词向量确定源语言和目标语言的对齐概率作为损失函数;并且基于所述损失函数进行训练,从而实现跨语言对齐的目的,提高了语言模型的质量。
语言转换模型的训练方法及装置.pdf
本申请实施例提供了一种语言转换模型的训练方法及装置,包括:获取数据表中的数据元素;生成用于查询数据元素的结构化查询语句样本和自然语句样本,自然语句样本中的词语与数据表中的数据元素之间具有映射关系;基于数据元素、自然语句样本、结构化查询语句样本和映射关系,对初始语言转换模型进行训练,得到目标语言转换模型。本申请中整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,本申请可以基于数据表的数据元素与自然语句中的词语之间的显性的映射关系,进行语言转换模型的训练,从而使得训练过程中可以有效挖
一种语言模型的训练方法及装置.pdf
本申请公开了一种语言模型的训练方法及装置,所述方法包括:在获取到包括大量样本文本的语言模型训练数据后,可以将这些样本文本进行分词处理,以得到每一分词的分词标签,其中,分词标签包括对应分词中的每一字在对应分词中的位置信息,接着,可以根据这些样本文本中每一分词的分词标签,对语言模型进行训练。可见,本申请将样本文本的分词标签作为训练数据对语言模型进行训练,使得训练语言模型所使用的数据更为全面,从而能够降低语言模型的PPL值,提升了语言模型的效果。
自然语言生成模型的训练方法和装置.pdf
本公开涉及一种自然语言生成模型的训练方法和装置,涉及计算机技术领域。该训练方法包括:以各历史时刻的生成词为当前时刻的状态,以当前时刻的生成词的输出为动作,将自然语言生成处理建模为强化学习模型;根据强化学习模型输出的各时刻的生成词的优势函数,确定第一目标函数;根据各时刻的标注结果的概率分布与各时刻的生成词的概率分布之间的差异,确定第二目标函数;根据第一目标函数、第二目标函数的加权平均值,训练强化学习模型。
一种语言模型的训练方法及装置、设备.pdf
本发明提供一种语言模型的训练方法及装置、设备,所述方法包括:采用离线训练方式获取通用语言模型,并对该通用语言模型进行裁剪,获得裁剪后的语言模型;采用在线训练方式获取预设时间段内日志的日志语言模型;将所述裁剪后的语言模型和所述日志语言模型进行融合,获得用于进行第一遍解码的第一融合语言模型;将所述通用语言模型和所述日志语言模型进行融合,获得用于进行第二遍解码的第二融合语言模型。上述方法解决现有技术离线获取的语言模型对新的语料覆盖不好,导致语言识别率降低的问题。