预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115019774A(43)申请公布日2022.09.06(21)申请号202210761146.2(22)申请日2022.06.29(71)申请人浙江大华技术股份有限公司地址310053浙江省杭州市滨江区滨安路1187号(72)发明人吴人杰方瑞东林聚财王宝俊殷俊史巍黄惠祥岳昌洁(74)专利代理机构北京同达信恒知识产权代理有限公司11291专利代理师张洁(51)Int.Cl.G10L15/00(2013.01)G10L15/01(2013.01)G10L15/08(2006.01)G10L15/22(2006.01)权利要求书5页说明书16页附图5页(54)发明名称语音唤醒方法、装置、电子设备及计算机存储介质(57)摘要本公开提供语音唤醒方法、装置、电子设备及计算机存储介质。用于提高语音唤醒的识别率,降低误唤醒的情况。包括:以第一时长为周期,周期性获取所述第一时长内的语音为待处理语音;基于连续获取的多个待处理语音对应的目标音素,得到多条排列路径;其中,所述目标音素是基于对应的待处理语音的状态似然值数组确定的,且所述状态似然值数组中包含所述待处理语音包含的各基础音素分别在各指定状态下对应的状态似然值,所述目标音素为所述各基础音素中的音素;并基于所述多条排列路径中的目标音素的状态似然值,从所述多个排列路径中确定出候选路径;对所述候选路径进行语音识别,并根据所述候选路径的语音识别的结果确定是否对目标设备进行唤醒。CN115019774ACN115019774A权利要求书1/5页1.一种语音唤醒方法,其特征在于,所述方法包括:以第一时长为周期,周期性获取所述第一时长内的语音为待处理语音;基于连续获取的多个待处理语音对应的目标音素,得到多条排列路径;其中,所述目标音素是基于对应的待处理语音的状态似然值数组确定的,且所述状态似然值数组中包含所述待处理语音包含的各基础音素分别在各指定状态下对应的状态似然值,所述目标音素为所述各基础音素中的音素;并,基于所述多条排列路径中的目标音素的状态似然值,从所述多个排列路径中确定出候选路径;对所述候选路径进行语音识别,并根据所述候选路径的语音识别的结果确定是否对目标设备进行唤醒。2.根据权利要求1所述的方法,其特征在于,所述基于连续获取的多个待处理语音对应的目标音素,得到多条排列路径之前,还包括:针对所述多个待处理语音中的各待处理语音进行如下操作:确定所述待处理语音的状态似然值数组中包含的状态似然值的最大值,并将所述最大值对应的基础音素,确定为所述待处理语音对应的目标音素。3.根据权利要求2所述的方法,其特征在于,所述确定所述待处理语音的状态似然值数组中包含的状态似然值的最大值之前,所述方法还包括:针对所述待处理语音的状态似然值数组中任意一个基础音素的任意一个指定状态,根据所述待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的状态似然值以及所述多个待处理语音的各状态似然值数组中与所述基础音素的指定状态相对应的各状态似然值,得到所述基础音素在所述指定状态下的平滑状态似然值;并,基于各基础音素的各指定状态的平滑状态似然值,得到所述待处理语音对应的平滑后的状态似然值数组。4.根据权利要求3所述的方法,其特征在于,所述根据所述待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的状态似然值以及所述多个待处理语音的各状态似然值数组中与所述基础音素的指定状态相对应的各状态似然值,得到与所述基础音素的指定状态相对应的平滑状态似然值,包括:将所述待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的状态似然值以及与所述多个待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的各状态似然值相加,得到所述基础音素的指定状态的总状态似然值;将所述总状态似然值与各待处理语音的总时长相除,得到所述基础音素的指定状态的平滑状态似然值。5.根据权利要求1所述的方法,其特征在于,所述基于连续获取的多个待处理语音对应的目标音素,得到多条排列路径,包括:针对所述多个待处理语音中的任意两个相邻的待处理语音,将所述两个相邻的待处理语音的目标音素按照获取时间的先后顺序相连接,得到与所述两个相邻的待处理语音相对应的排列路径;基于各相邻的两个待处理语音对应的排列路径,得到所述多条排列路径。6.根据权利要求1所述的方法,其特征在于,所述基于所述多条排列路径中的目标音素2CN115019774A权利要求书2/5页的状态似然值,从所述多个排列路径中确定出候选路径,包括:将所述多条排列路径中概率值最高的排列路径确定为所述候选路径。7.根据权利要求1所述的方法,其特征在于,通过以下方式得到候选路径的语音识别的结果:针对任意一个候选路径,基于所述候选路径的概率值,确定所