生成标记语料的方法、装置、终端设备及存储介质.pdf
光誉****君哥
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
生成标记语料的方法、装置、终端设备及存储介质.pdf
本申请提供了一种生成标记语料的方法、装置、终端设备及存储介质,该方法包括:针对任一正确语句,确定正确语句中的至少一个待替换字符;确定每个待替换字符对应的至少两个候选替换字符;根据每个待替换字符和每个待替换字符对应的至少两个候选替换字符,获得正确语句对应的至少两个错误语句;通过预设自然语言模型获得每个错误语句的评估结果,以及根据每个错误语句的评估结果确定正确语句对应的目标错误语句。通过上述方法,可以高效获得高质量的标记语料。
语料生成方法、装置、计算机可读存储介质及终端设备.pdf
本申请属于人工智能技术领域,尤其涉及一种语料生成方法、装置、计算机可读存储介质及终端设备。所述方法包括:通过预设的会话机器人生成第一会话语料数据集,所述第一会话语料数据集中包括各条会话语料;对所述第一会话语料数据集中的各条会话语料进行清洗,得到第二会话语料数据集,所述第二会话语料数据集中包括清洗后的各条会话语料。在本申请中,可以通过会话机器人来进行会话语料的生成,而会话机器人自动生成的会话语料是无限的,可以得到数量充足的会话语料,而且通过对会话语料的清洗,可以过滤掉大量低质量的会话语料,只保留其中较高质量
标记生成、模型训练、标记方法、装置、存储介质及设备.pdf
本申请涉及标记生成、模型训练、标记方法、装置、存储介质及设备。其中,标记生成方法包括:获取目标物的待标记图;获取待标记图对应的转换图;获取目标物的基准图;关联转换图和基准图,以得到转换关系或变换关系;基于转换关系或变换关系,映射基准标记,以得到标记。采用本申请的技术方案实现图像标记的自动化。
文本纠错语料生成方法、装置、设备及存储介质.pdf
本公开提供了一种文本纠错语料生成方法、装置、设备及存储介质,通过将原始语料进行预处理,得到待处理语料,获取所述待处理语料的实体信息,并根据所述待处理语料的实体信息确定所述待处理语料的多个错误位置,根据错误类型共存策略,在所述待处理语料的多个错误位置设置错误文本,以生成初步文本纠错语料,通过语言困惑模型过滤所述初步文本纠错语料,得到目标文本纠错语料,本公开可以更加高效、便捷的获得多样化本文本纠错语料,以满足各种类型的供后续文本纠错模型训练使用。
语料生成方法、装置、电子设备及存储介质.pdf
语料生成方法、装置、电子设备及存储介质,其中,所述语料生成方法包括:获取目标语言类型的第一语料;将所述第一语料输入已训练好的翻译模型阵列进行翻译,得到多个翻译结果;其中,所述翻译模型阵列包括将所述第一语料翻译为其他语言类型语料的翻译模型,以及将所述其他语言类型语料翻译为所述目标语言类型的翻译模型,且所述翻译模型阵列中各翻译模型按照预设顺序设置;计算所述多个翻译结果与所述第一语料的编辑距离,得到所述第一语料相对应的目标语料。采用上述方案,能够提高获取平行语料的效率。