预训练语言模型的方法和装置.pdf
睿达****的的
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
预训练语言模型的方法和装置.pdf
本说明书实施例提供一种预训练语言模型的方法和装置,方法包括:获取历史对话记录中的第一角色的第一语句,以及第二角色的第二语句;历史对话记录包括多轮对话中各轮对话的语句;将第一语句和第二语句拼接成第一样本;将第一样本中预设比例的字进行遮蔽,得到第二样本;对第二样本中任意一个字的字嵌入向量、字类型嵌入向量、位置嵌入向量和附加嵌入向量进行叠加,得到该字的初始字表达向量;将第二样本中各个字的初始字表达向量输入语言模型,基于包括第一任务在内的至少一项预训练任务对语言模型进行预训练,第一任务用于预测第二样本中被遮蔽的字
建立预训练语言模型的方法、语义解析方法和装置.pdf
本申请实施例公开了一种建立预训练语言模型的方法、语义解析方法和装置。技术方案包括:获取第一训练数据,第一训练数据包括多于一组的多轮对话样本对和关联表格的模式信息,多轮对话样本对包括一个对话中的多个由自然语言文本及其对应的结构化查询语言(SQL)语句构成的样本对;利用第一训练数据训练得到包括嵌入(Embedding)层和转换(Transformer)网络的预训练语言模型;在训练过程中,将自然语言文本、该自然语言文本的上下文以及模式信息构成的输入序列输入预训练语言模型,执行会话语义解析任务、对话编辑策略预测任
语言模型的训练及分词预测方法和装置、语言模型.pdf
本说明书实施例提供一种语言模型的训练及分词预测方法和装置、语言模型,采用分词及其笔画集合来训练语言模型以及预测目标分词,由于提取出分词级以及笔画级的特征,特征粒度更小,因此,训练出的语言模型准确度较高,预测目标分词的准确性也越高。
预训练语言模型的生成方法、装置、电子设备和存储介质.pdf
本公开提供了一种预训练语言模型的生成方法、装置、电子设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、知识图谱和深度学习等人工智能技术领域。具体实现方案为:获取样本文档;对样本文档进行解析,以获取样本文档的排版结构信息和文字信息;获取预训练语言模型的多个任务模型;根据排版结构信息和文字信息对预训练语言模型和多个任务模型进行联合训练,以生成训练之后的预训练语言模型;以及根据排版结构信息和文字信息对训练之后的预训练语言模型进行微调训练,以生成目标预训练语言模型。由此,目标预训练语言模型可以快速的进行任
预训练语言模型的构建方法、装置、电子终端及存储介质.pdf
本发明实施例公开了一种预训练语言模型的构建方法、装置、电子终端及存储介质,该方法包括:获取对话数据;根据各预训练任务的任务要求对对话数据进行处理,得到训练数据以及训练数据在各预训练任务下的标签数据;各预训练任务包括:全词掩码预测任务、角色预测任务、轮次内顺序互换预测任务和轮次间顺序互换预测任务;基于训练数据确定语言模型的输入数据,通过语言模型对输入数据执行各预训练任务,得到各执行结果;根据各执行结果以及训练数据在各预训练任务下的标签数据,对语言模型进行训练,得到预训练语言模型;预训练语言模型用于对对话数据