文本识别、模型训练方法、装置、设备、存储介质及程序.pdf
fu****级甜
亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本识别、模型训练方法、装置、设备、存储介质及程序.pdf
本公开提供了文本识别、模型训练方法、装置、设备、存储介质及程序,涉及人工智能领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可用于OCR场景。具体实现方案为:获取待识别的文本图像,对所述文本图像进行特征提取,得到所述文本图像对应的图像特征;所述图像特征在高度和宽度方向上的特征维度数均大于1,根据所述图像特征,确定所述文本图像中的多个采样点对应的采样特征,根据所述多个采样点对应的采样特征,确定所述文本图像对应的字符识别结果。本公开提供的技术方案,针对包含任意形态字符的文本图像,均能够提高字符识别结果的
文本识别模型的训练方法、装置、电子设备及存储介质.pdf
本公开实施例公开了一种文本识别模型的训练方法、装置、电子设备及存储介质,所述方法包括:获取样本文本中样本句子的多个样本分词;通过将所述样本分词输入至所述主干模型获取对应于所述样本句子的第一输出结果,以及通过将所述样本分词输入至所述辅助模型获取对应于所述样本分词的第二输出结果;所述第一输出结果至少用于表示所述主干模型所述样本句子是否涉及目标内容,所述第二输出结果至少用于表示所述样本分词是否涉及所述目标内容;利用所述第一输出结果和第二输出结果对所述主干模型和所述辅助模型的模型参数进行调整;所述主干模型和辅助模
语音识别模型的训练方法、装置、设备及存储介质.pdf
本申请公开了一种语音识别模型的训练方法、装置、设备及存储介质,属于人工智能领域。所述方法包括:获取样本音频集,所述样本音频集中包括多个样本音频;基于初始语音识别模型,在所述样本音频集中筛选候选样本音频;在所述候选样本音频中提取音频片段;其中,所述音频片段包括所述候选样本音频中与连续相同文本单元对齐的音频;且,所述初始语音识别模型在对所述候选样本音频进行语音识别时,未正确识别所述连续相同文本单元;根据所述音频片段对所述初始语音识别模型进行再训练,得到目标语音识别模型。本申请能够提升语音识别质量,特别是提升了
语音识别模型的训练方法、装置、设备及存储介质.pdf
本申请实施例提供一种语音识别模型的训练方法、装置、设备及存储介质,获取多个样本语音数据;根据关键词对应的声学特征中的信号帧进行建模,得到初始声学模型,每个声学特征包含多个信号帧;利用多个样本语音数据对初始声学模型进行训练,得到目标声学模型;根据目标声学模型构建语音识别模型。本申请通过关键词对应的帧级别的声学特征来构建声学模型,无需对样本语音数据进行对齐处理,训练过程相对简单,可以提升训练效率。
文本识别模型的训练方法、文本识别方法、电子设备、存储介质.pdf
本申请提供一种文本识别模型的训练方法、文本识别方法、电子设备、计算机可读存储介质,方法包括:获取目标文字的多条语料数据;多条语料数据包括RTL文字对应的第一语料数据和LTR文字对应的第二语料数据;根据多种组合方式,对第一语料数据和所述第二语料数据进行组合,获得与每一组合方式对应的组合语料数据;生成与每一组合语料数据对应的样本图片和标签,并基于样本图片和标签构建样本数据;根据样本数据对深度学习模型进行训练,得到文本识别模型。本申请方案,通过生成复杂的双向文本的样本数据,可以训练出对双向文本准确识别的文本识别