预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114299933A(43)申请公布日2022.04.08(21)申请号202111626762.9(22)申请日2021.12.28(71)申请人北京声智科技有限公司地址100094北京市海淀区北清路81号院一区1号楼6层601(72)发明人李良斌陈孝良(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人王静(51)Int.Cl.G10L15/06(2013.01)G10L15/10(2006.01)G10L15/22(2006.01)权利要求书3页说明书17页附图4页(54)发明名称语音识别模型训练方法、装置、设备、存储介质及产品(57)摘要本申请公开了一种语音识别模型训练方法、装置、设备、存储介质及产品,属于互联网技术领域。该方法先获取多个非人声音频,通过第一语音识别模型对多个非人声音频进行识别,得到每个非人声音频对应的识别结果,基于该识别结果,确定被识别为人声音频的多个第一非人声音频,从多个第一非人声音频中,确定目标非人声音频,将目标非人声音频与不包含唤醒词的人声音频作为负样本,将包含唤醒词的人声音频作为正样本,基于负样本和正样本进行模型训练,得到用于识别唤醒词的第二语音识别模型。该第二语音识别模型在识别唤醒词时,可以消除与唤醒词相似的非人声音频对识别唤醒词的影响,避免误唤醒,从而降低误唤醒率。CN114299933ACN114299933A权利要求书1/3页1.一种语音识别模型训练方法,其特征在于,所述方法包括:获取多个非人声音频;通过预先训练好的第一语音识别模型对所述多个非人声音频进行识别,得到每个非人声音频对应的识别结果,所述第一语音识别模型是通过多个人声音频训练得到的;基于每个非人声音频对应的识别结果,确定多个第一非人声音频,所述第一非人声音频为被识别为人声音频的非人声音频;从所述多个第一非人声音频中,确定与包含唤醒词的人声音频之间的相似度满足相似度条件的目标非人声音频;将所述目标非人声音频与不包含唤醒词的人声音频作为负样本,将所述包含唤醒词的人声音频作为正样本,基于所述负样本和所述正样本进行模型训练,得到第二语音识别模型,所述第二语音识别模型用于识别唤醒词。2.根据权利要求1所述的方法,其特征在于,所述从所述多个第一非人声音频中,确定与包含唤醒词的人声音频之间的相似度满足相似度条件的目标非人声音频,包括:对于每个第一非人声音频,对所述第一非人声音频进行解码,确定所述第一非人声音频对应的解码参数;基于所述第一非人声音频对应的解码参数,确定所述第一非人声音频与所述包含唤醒词的人声音频之间的相似度,得到多个相似度;基于每个第一非人声音频对应的相似度,确定相似度满足所述相似度条件的目标非人声音频。3.根据权利要求2所述的方法,其特征在于,所述对所述第一非人声音频进行解码,确定所述第一非人声音频对应的解码参数,包括:确定所述第一非人声音频包括的音频帧;基于预先训练好的声学模型,确定所述音频帧对应的声学解码参数;基于预先训练好的语言学模型,确定所述音频帧对应的语言解码参数;基于所述声学解码参数和所述语言解码参数,确定所述解码参数。4.根据权利要求2所述的方法,其特征在于,所述相似度条件为相似度不小于预设相似度阈值;所述基于每个第一非人声音频对应的相似度,确定相似度满足所述相似度条件的目标非人声音频,包括:基于每个第一非人声音频对应的相似度,将相似度不小于所述预设相似度阈值的第一非人声音频确定为所述目标非人声音频。5.根据权利要求2所述的方法,其特征在于,所述相似度条件为相似度最高的预设数量个第一非人声音频;所述基于每个第一非人声音频对应的相似度,确定相似度满足所述相似度条件的目标非人声音频,包括:基于每个第一非人声音频对应的相似度,从多个相似度中选择相似度最高的预设数量个第一非人声音频,得到所述目标非人声音频。6.根据权利要求1所述的方法,其特征在于,所述基于所述负样本和所述正样本进行模型训练,得到第二语音识别模型,包括:2CN114299933A权利要求书2/3页获取第一初始模型;基于所述负样本和所述正样本,对所述第一初始模型进行训练,得到所述第二语音识别模型。7.根据权利要求1所述的方法,其特征在于,所述基于所述负样本和所述正样本进行模型训练,得到第二语音识别模型,包括:获取第二初始模型,所述第二初始模型由所述不包含唤醒词的人声音频和所述正样本训练得到;基于所述负样本和所述正样本,在所述第二初始模型的基础上进行增强训练,得到所述第二语音识别模型。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取待识别的语音音频;将所述语音音频输入所述第二语音识别模型中,得到所述语音音频对应的识别结果;若所述语音音频对应的识别