文本数据增强方法及装置、电子设备、存储介质.pdf
是秋****写意
亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本数据增强方法及装置、电子设备、存储介质.pdf
本公开提供了一种文本数据增强方法及装置、电子设备、存储介质,涉及计算机技术领域。该文本数据增强方法包括:生成文本数据泛化后的分词序列和词向量;确定每次从分词序列随机抽选分词生成的目标分词序列、替换目标分词序列的中心词得到的候选分词序列、与每一目标分词序列对应的目标矩阵、与每一候选分词序列对应的候选矩阵;计算每一目标矩阵和候选矩阵中不同词向量之间的相似度平均和,并将与相似度平均和大于相似度阈值对应的候选矩阵的候选分词序列的中心词作为备选词,以从备选词中选取相似度平均和较大的目标备选词作为替换词,并基于替换词
数据增强方法及装置、存储介质、电子设备.pdf
本公开属于数据处理技术领域,涉及一种数据增强方法及装置、存储介质、电子设备。该方法包括:获取原始文本以及与原始文本对应的类别标签,并根据类别标签确定原始文本要增强的增强数量;基于增强数量,对原始文本中进行替换得到初始增强文本,并计算原始文本和初始增强文本之间的目标相似度;根据目标相似度对初始增强文本进行过滤得到目标增强文本,以利用目标增强文本和原始文本训练文本分析模型。本公开对不同领域的原始文本设置定制化的数量,保证了增强数据的类别平衡性,在无需人工标注的情况下提供了自动生成增强文本的方法,保证了目标增强
数据增强方法、装置、电子设备及存储介质.pdf
本发明实施例提供的数据增强方法、装置、电子设备及存储介质,应用于信息技术领域,可以获取待处理图像集,其中,所述待处理图像集中包括至少一张待处理图像;识别所述待处理图像集的应用场景;获取所述应用场景对应的历史图像集的目标亮度范围;根据所述目标亮度范围对所述待处理图像集中的各所述待处理图像的亮度进行调整,得到调整后的图像。通过待处理图像集的应用场景获取对应的历史图像集的目标亮度范围,从而根据目标亮度范围进行待处理图像集中的待处理图像进行亮度的调整,不但可以通过获取多个调整后的图像实现数据增强,还可以降低人工成
数据增强方法、数据增强装置、电子设备和存储介质.pdf
本申请公开了一种数据增强方法、数据增强装置、电子设备和存储介质,方法包括:获取目标地理区域的灰度遥感图像;从灰度遥感图像中截取多张局部图像;从多张局部图像中,筛选出局部图像中物类的数量在数量阈值内的目标局部图像;以目标局部图像中的一像素点为极点,将获得的极坐标空间下的目标局部图像中的所有像素点,通过径向变换算法映射到二维空间中,得到变换后的像素点组成的增强后的目标局部图像;极坐标空间是以极点和以极点为起点的极轴构建的。
一种文本增强方法、装置、电子设备和存储介质.pdf
本申请公开了一种文本增强方法、装置、电子设备和存储介质;可以从目标文本的文本单元中选取至少一个待替换的目标文本单元;当目标文本单元的字符数量大于预设数量,且其语言类型为目标语言时,基于目标文本单元与候选文本单元之间的相似度,从候选文本单元中选取所述目标文本单元的相似文本单元;当目标文本单元的字符数量不大于预设数量,或目标文本单元的语言类型为非目标语言时,根据目标文本单元的上下文信息和候选文本单元之间的相似度,从候选文本单元中选取所述目标文本单元的相似文本单元;基于各个目标文本单元的相似文本单元,对目标文本