预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114255761A(43)申请公布日2022.03.29(21)申请号202111535270.9(22)申请日2021.12.15(71)申请人北京声智科技有限公司地址100094北京市海淀区北清路81号院一区1号楼6层601(72)发明人陈孝良李良斌(74)专利代理机构北京东方亿思知识产权代理有限责任公司11258代理人陈思凡(51)Int.Cl.G10L15/26(2006.01)G10L15/06(2013.01)G10L15/22(2006.01)权利要求书2页说明书9页附图1页(54)发明名称语音识别方法、装置、设备、存储介质和计算机程序产品(57)摘要本申请公开了一种语音识别方法、装置、设备、存储介质和计算机程序产品。本申请实施例提供的语音识别方法包括:获取待识别的第一语音;根据目标语音识别模型,确定待识别的第一语音对应的第一文本信息,其中,目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的,目标词集包括在预设时间段内初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。根据本申请实施例,能够解决语音识别系统识别效率和识别准确率相对较低,影响用户使用体验的问题。CN114255761ACN114255761A权利要求书1/2页1.一种语音识别方法,其特征在于,所述方法包括:获取待识别的第一语音;根据目标语音识别模型,确定所述待识别的第一语音对应的第一文本信息,其中,所述目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的,所述目标词集包括在预设时间段内所述初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。2.根据权利要求1所述的方法,其特征在于,在所述根据目标语音识别模型,确定所述待识别的第一语音对应的第一文本信息之前,所述方法还包括:获取待识别的第二语音;在所述预设时间段内,根据所述初始语音识别模型,确定所述第二语音对应的第二文本信息,其中,所述第二文本信息中包括第二关键词组合,所述第二关键词组合包括多个第二关键词;根据所述初始语音模型对所述第二文本信息中每个所述第二关键词的识别概率,确定所述初始语音识别模型对所述第二文本信息的第一识别概率;在所述第一识别概率小于第一预设阈值的情况下,将所述第二关键词组合确定为所述第一关键词组合,以及将所述第二关键词组合加入所述目标词集。3.根据权利要求2所述的方法,其特征在于,所述在所述第一识别概率小于第一预设阈值的情况下,将所述第二关键词组合确定为所述第一关键词组合,包括:获取所述预设时间段内,对所述第二语音的识别频率;在所述识别频率大于第二预设阈值,且所述第一识别概率小于所述第一预设阈值的情况下,将所述第二关键词组合确定为所述第一关键词组合。4.根据权利要求1所述的方法,其特征在于,在所述根据目标语音识别模型,确定所述待识别语音对应的文本信息之前,所述方法还包括:获取待识别的第三语音;在所述预设时间段内,根据所述初始语音识别模型,确定所述第三语音对应的第三文本信息,其中,所述第三文本信息包括第三关键词;根据所述初始语音模型对所述第三关键词中每个文字的识别概率,确定所述初始语音识别模型对所述第三关键词的第二识别概率;在所述第二识别概率小于第三预设阈值的情况下,将所述第三关键词确定为所述未识别的第一关键词,将所述未识别的第一关键词加入所述目标词集。5.根据权利要求1所述的方法,其特征在于,在所述根据目标语音识别模型,确定所述待识别的第一语音对应的第一文本信息之前,所述方法包括:在所述目标词集满足预设更新条件的情况下,获取所述目标词集中每个第一文本信息的音素信息;根据每个第一文本信息的音素信息,更新所述初始语音识别模型中的发音词典,得到所述目标语音识别模型。6.一种语音识别装置,其特征在于,所述装置包括:获取模块,用于获取待识别的第一语音;处理模块,用于根据目标语音识别模型,确定所述待识别的第一语音对应的第一文本2CN114255761A权利要求书2/2页信息,其中,所述目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的,所述目标词集包括在预设时间段内所述初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。7.根据权利要求6所述的装置,其特征在于,所述获取模块,还用于获取待识别的第二语音;所述处理模块,还用于在所述预设时间段内,根据所述初始语音识别模型,确定所述第二语音对应的第二文本信息,其中,所述第二文本信息中包括第二关键词组合,所述第二关键词组合包括多个第二关键词;所述处理模块,还用于根据所述初始语音模型对所述第二文本信息中每个所述第二关键词的识别概率,确定所述初始语音识别模型对所述第二文本信息的第一识别概率;所述