语音识别、网络模型的训练方法、装置、设备和存储介质.pdf
书生****aa
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音识别、网络模型的训练方法、装置、设备和存储介质.pdf
本申请提供了一种语音识别、网络模型的训练方法、装置、设备和存储介质,解决了现有技术中语音识别系统识别效果较差的问题。基于初始说话人波束和多路语音信号确定第一目标说话人波束,初始说话人波束基于多路语音信号的波束成形过程得到,第一目标说话人波束指示多路语音信号各自在初始说话人波束所在方向上的声音信息;基于第一目标说话人波束和多路语音信号确定噪声波束,噪声波束指示多路语音信号中除了第一目标说话人波束之外的声音信息;基于噪声波束和唤醒波束对第一目标说话人波束进行滤波,得到第二目标说话人波束,唤醒波束指示包含唤醒词
语音识别模型的训练方法、装置、设备及存储介质.pdf
本申请公开了一种语音识别模型的训练方法、装置、设备及存储介质,属于人工智能领域。所述方法包括:获取样本音频集,所述样本音频集中包括多个样本音频;基于初始语音识别模型,在所述样本音频集中筛选候选样本音频;在所述候选样本音频中提取音频片段;其中,所述音频片段包括所述候选样本音频中与连续相同文本单元对齐的音频;且,所述初始语音识别模型在对所述候选样本音频进行语音识别时,未正确识别所述连续相同文本单元;根据所述音频片段对所述初始语音识别模型进行再训练,得到目标语音识别模型。本申请能够提升语音识别质量,特别是提升了
语音识别模型的训练方法、装置、设备及存储介质.pdf
本申请实施例提供一种语音识别模型的训练方法、装置、设备及存储介质,获取多个样本语音数据;根据关键词对应的声学特征中的信号帧进行建模,得到初始声学模型,每个声学特征包含多个信号帧;利用多个样本语音数据对初始声学模型进行训练,得到目标声学模型;根据目标声学模型构建语音识别模型。本申请通过关键词对应的帧级别的声学特征来构建声学模型,无需对样本语音数据进行对齐处理,训练过程相对简单,可以提升训练效率。
语音识别模型训练方法、装置、设备、存储介质及产品.pdf
本申请公开了一种语音识别模型训练方法、装置、设备、存储介质及产品,属于互联网技术领域。该方法先获取多个非人声音频,通过第一语音识别模型对多个非人声音频进行识别,得到每个非人声音频对应的识别结果,基于该识别结果,确定被识别为人声音频的多个第一非人声音频,从多个第一非人声音频中,确定目标非人声音频,将目标非人声音频与不包含唤醒词的人声音频作为负样本,将包含唤醒词的人声音频作为正样本,基于负样本和正样本进行模型训练,得到用于识别唤醒词的第二语音识别模型。该第二语音识别模型在识别唤醒词时,可以消除与唤醒词相似的非
语音识别模型的训练方法、装置、存储介质及电子设备.pdf
本公开涉及语音识别领域,具体涉及一种语音识别模型的训练方法、装置、存储介质及电子设备。该语音识别模型的训练方法包括构建初始语音识别模型;固定第二初始参数,基于无标注数据集计算对比学习损失函数以将第一初始参数调整为第一中间参数;固定第一中间参数,基于有标注数据集计算第一联合损失函数以将第二初始参数调整为第二中间参数;基于有标注数据集计算第二联合损失函数,并根据第二联合损失函数对第一网络和第二网络进行训练,以调整第一中间参数和第二中间参数得到目标语音识别模型。本公开提供的语音识别模型的训练方法能够解决语音识别