预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114299960A(43)申请公布日2022.04.08(21)申请号202111560478.6(22)申请日2021.12.20(71)申请人北京声智科技有限公司地址100094北京市海淀区北清路81号院一区1号楼6层601(72)发明人郭震陈孝良(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人王静(51)Int.Cl.G10L15/26(2006.01)G10L15/22(2006.01)G10L15/06(2013.01)权利要求书2页说明书10页附图3页(54)发明名称语音识别方法、装置、电子设备及存储介质(57)摘要本公开提供了一种语音识别方法、装置、电子设备及存储介质,属于互联网技术领域。所述方法包括:将目标文本内容与指令文本模板进行匹配;当目标文本内容与任一指令文本模板相匹配,目标指令词在目标文本内容中的位置满足预设位置条件,执行目标指令词对应的操作。本公开在调用语音识别模型得到目标文本内容后,未直接基于该目标文本内容中的目标指令词执行相应操作,而是将该目标文本内容与多个指令文本模板进行匹配,在目标文本内容与任一指令文本模板相匹配的情况下,根据目标指令词在目标文本内容的位置确定是否执行目标指令词对应的操作,从而避免将无指令意图的目标语音信息作为指令性语音信息,提高了识别结果的准确性,减少了误识别次数。CN114299960ACN114299960A权利要求书1/2页1.一种语音识别方法,其特征在于,所述方法包括:获取目标语音信息;调用语音识别模型,对所述目标语音信息进行识别,所述语音识别模型用于将语音信息转换为文本内容;当得到包含目标指令词的目标文本内容,将所述目标文本内容与多个指令文本模板进行匹配;当所述目标文本内容与任一指令文本模板相匹配,且所述目标指令词在所述指令文本模板中的位置满足预设位置条件,执行所述目标指令词对应的操作。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述目标文本内容与所述多个指令文本模板均不匹配,不执行所述目标指令词对应的操作;或者,当所述目标文本内容与任一指令文本模板相匹配,所述目标指令词在所述目标文本内容中的位置不满足预设位置条件,不执行所述目标指令词对应的操作。3.根据权利要求1所述的方法,其特征在于,所述语音识别模型的构建过程为:获取多个语音训练样本,所述多个语音训练样本包含的非指令词中所有字音相同的单字均采用同一代表字表示;基于所述多个语音训练样本,构建所述语音识别模型。4.根据权利要求3所述的方法,其特征在于,所述多个语音训练样本包括多个语音训练正样本和多个语音训练负样本,每个语音训练正样本包含一个指令词,所述获取多个语音训练样本,包括:按照预设比例,获取语音训练正样本和语音训练负样本,得到所述多个语音训练样本,所述预设比例用于实现各个指令词在所述多个语音训练样本中的出现频率满足预设频率条件。5.根据权利要求3所述的方法,其特征在于,所述基于所述多个语音训练样本,构建所述语音识别模型,包括:获取所述多个语音训练样本包含的各个词语组合;确定每个词语组合在同字数的词语组合中的出现频率;根据不同字数的词语组合的出现频率,构建所述语音识别模型。6.一种语音识别装置,其特征在于,所述装置包括:第一获取模块,用于获取目标语音信息;识别模块,用于调用语音识别模型,对所述目标语音信息进行识别,所述语音识别模型用于将语音信息转换为文本内容;匹配模块,用于当得到包含目标指令词的目标文本内容,将所述目标文本内容与多个指令文本模板进行匹配;执行模块,用于当所述目标文本内容与任一指令文本模板匹配,且所述目标指令词在所述目标文本内容中的位置满足预设位置条件,执行所述目标指令词对应的操作。7.根据权利要求6所述的装置,其特征在于,所述执行模块,用于当所述目标文本内容与所述多个指令文本模板均不匹配,不执行所述目标指令词对应的操作;或者,所述执行模块,用于当所述目标文本内容与任一指令文本模板相匹配,所述目标指令2CN114299960A权利要求书2/2页词在所述目标文本内容中的位置不满足预设位置条件,不执行所述目标指令词对应的操作。8.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1至5中任一项所述的语音识别方法。9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至5中任一项所述的语音识别方法。10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序代码,所述计算机程序代码存储在计算机