一种文本增强方法、装置、电子设备和存储介质.pdf
丹烟****魔王
亲,该文档总共31页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种文本增强方法、装置、电子设备和存储介质.pdf
本申请公开了一种文本增强方法、装置、电子设备和存储介质;可以从目标文本的文本单元中选取至少一个待替换的目标文本单元;当目标文本单元的字符数量大于预设数量,且其语言类型为目标语言时,基于目标文本单元与候选文本单元之间的相似度,从候选文本单元中选取所述目标文本单元的相似文本单元;当目标文本单元的字符数量不大于预设数量,或目标文本单元的语言类型为非目标语言时,根据目标文本单元的上下文信息和候选文本单元之间的相似度,从候选文本单元中选取所述目标文本单元的相似文本单元;基于各个目标文本单元的相似文本单元,对目标文本
文本数据增强方法及装置、电子设备、存储介质.pdf
本公开提供了一种文本数据增强方法及装置、电子设备、存储介质,涉及计算机技术领域。该文本数据增强方法包括:生成文本数据泛化后的分词序列和词向量;确定每次从分词序列随机抽选分词生成的目标分词序列、替换目标分词序列的中心词得到的候选分词序列、与每一目标分词序列对应的目标矩阵、与每一候选分词序列对应的候选矩阵;计算每一目标矩阵和候选矩阵中不同词向量之间的相似度平均和,并将与相似度平均和大于相似度阈值对应的候选矩阵的候选分词序列的中心词作为备选词,以从备选词中选取相似度平均和较大的目标备选词作为替换词,并基于替换词
语料增强方法、装置、电子设备和存储介质.pdf
本申请实施例公开了一种语料增强方法、装置、电子设备和存储介质。获取原始语料中源语言的待替换短语的至少一个候选替换短语;根据候选替换短语,生成源语言的对抗样本;根据对抗样本生成正向对抗样本和反向对抗样本;根据原始语料、正向对抗样本和反向对抗样本确定增强语料。本申请实施例提高了增强语料的质量,进而提高了翻译模型的鲁棒性和准确性。
数据增强方法、数据增强装置、电子设备和存储介质.pdf
本申请公开了一种数据增强方法、数据增强装置、电子设备和存储介质,方法包括:获取目标地理区域的灰度遥感图像;从灰度遥感图像中截取多张局部图像;从多张局部图像中,筛选出局部图像中物类的数量在数量阈值内的目标局部图像;以目标局部图像中的一像素点为极点,将获得的极坐标空间下的目标局部图像中的所有像素点,通过径向变换算法映射到二维空间中,得到变换后的像素点组成的增强后的目标局部图像;极坐标空间是以极点和以极点为起点的极轴构建的。
文本翻译方法、装置、电子设备和存储介质.pdf
本发明提供一种文本翻译方法、装置、电子设备和存储介质,所述方法包括:确定源语言文本;基于机器翻译模型,对源语言文本进行类别识别,并基于识别所得的类别对应的翻译参数对源语言文本进行翻译,得到目标语言文本;机器翻译模型基于各类别的样本源语言文本以及样本源语言文本的样本目标语言文本训练得到。本发明提供的文本翻译方法、装置、电子设备和存储介质,采用识别所得的源语言文本类别对应的翻译参数对源语言文本进行翻译,不仅可以保证翻译精度,而且可以避免传统方法中基于大量翻译参数进行计算导致翻译效率较低的问题。