语音识别方法、模型训练方法、装置、介质、电子设备.pdf
猫巷****婉慧
亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音识别方法、模型训练方法、装置、介质、电子设备.pdf
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及语音识别方法、模型训练方法、装置、介质、电子设备。方法包括:将待识别音频数据输入至第一语音特征提取子模型,得到待识别音频数据的初始特征数据;将初始特征数据输入第二语音特征提取子模型中,第二语音特征提取子模型包括频域分支以及时域分支,频域分支用于输出待识别音频数据的频域特征数据,时域分支用于输出的待识别音频数据的时域特征数据;将频域特征数据和时域特征数据输入语音鉴伪子模型中,得到待识别音频数据的分类结果,分类结果用以指示待识别音频数据是否为真
声学模型训练方法、语音识别方法、装置及电子设备.pdf
本发明公开了一种声学模型训练方法、语音识别方法、装置及电子设备,所述声学模型训练方法包括:获取双语混合字典,双语混合字典包括词汇与发音标注的对应关系,双语混合字典中的外语词汇对应的发音标注包括至少一个声母和/或韵母;根据双语混合字典,确定训练数据集中的训练数据对应的文本包含的词汇对应的发音标注,训练数据至少包括双语混合音频数据;根据所确定的发音标注,得到文本对应的发音标注序列,并将发音标注序列确定为训练数据的训练标签;根据训练数据和训练数据的训练标签,对声学模型进行训练。本发明实施例提供的技术方案,训练得
语音合成模型的训练方法、装置、电子设备及存储介质.pdf
本申请公开了语音合成模型的训练方法、装置、电子设备及存储介质。方法包括:获取待处理的初始文本,并检测初始文本携带的字符,得到初始文本对应的初始韵律结构;获取初始文本对应的目标个性化语音,并确定目标个性化语音所包括每一个音素的对齐结果;利用对齐结果修正初始文本对应的初始韵律结构,得到目标韵律结构,并基于目标音律结构生成目标文本;基于目标文本的目标韵律结构以及目标个性化语音训练预设神经网络模型,得到语音合成模型。本申请通过对齐结果对初始韵律结构中不连贯的部分进行修正,通过目标文本保证录音和文本的韵律结构一致。
语音识别模型的训练方法、装置、存储介质及电子设备.pdf
本公开涉及语音识别领域,具体涉及一种语音识别模型的训练方法、装置、存储介质及电子设备。该语音识别模型的训练方法包括构建初始语音识别模型;固定第二初始参数,基于无标注数据集计算对比学习损失函数以将第一初始参数调整为第一中间参数;固定第一中间参数,基于有标注数据集计算第一联合损失函数以将第二初始参数调整为第二中间参数;基于有标注数据集计算第二联合损失函数,并根据第二联合损失函数对第一网络和第二网络进行训练,以调整第一中间参数和第二中间参数得到目标语音识别模型。本公开提供的语音识别模型的训练方法能够解决语音识别
语音识别模型的训练方法、语音识别方法、装置及设备.pdf
本申请提供了一种语音识别模型的训练方法、语音识别方法、装置及设备,属于语音识别技术领域。所述语音识别模型的训练方法包括:通过所述语音识别模型中的第一编码器,对样本语音片段的样本特征序列中多个特征子序列分别进行编码,得到多个第一特征编码;对所述多个第一特征编码进行分块,得到多个特征块;通过所述语音识别模型中的第二编码器,对所述多个特征块分别进行编码,得到多个第二特征编码;对所述多个第一特征编码和所述多个第二特征编码分别进行解码,得到多个解码文本;基于所述多个解码文本与所述样本语音片段的标注文本之间的差异,训