预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111933111A(43)申请公布日2020.11.13(21)申请号202010809091.9(22)申请日2020.08.12(71)申请人北京猎户星空科技有限公司地址100026北京市朝阳区工人体育场北甲二号盈科中心东侧裙楼三层(72)发明人吕安超李家魁陈都李宝祥(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人张大威(51)Int.Cl.G10L15/02(2006.01)G10L15/16(2006.01)G10L15/22(2006.01)G10L15/26(2006.01)权利要求书2页说明书15页附图5页(54)发明名称语音唤醒方法、装置、电子设备和存储介质(57)摘要本申请提出一种语音唤醒方法、装置、电子设备和存储介质。其中该语音唤醒方法包括:通过多路语音通道接收语音信号,提取每路语音通道所采集的语音数据的第一音频特征向量;根据每路语音通道所采集的语音数据的第一音频特征向量,获取语音信号的融合音频特征向量;根据预先训练的神经网络对融合音频特征向量进行处理,获取与语音信号对应的标签序列;其中,标签序列为语音信号对应的语音单元或文本形成的序列;根据标签序列,识别语音信号中是否包含预设的唤醒指令。本申请实施例结合了各自语音通道的音频特征信息,在很大程度上利用了所有语音通道音频的特征信息,可以提高唤醒词识别的准确率。CN111933111ACN111933111A权利要求书1/2页1.一种语音唤醒方法,其特征在于,包括:通过多路语音通道接收语音信号,提取每路所述语音通道所采集的语音数据的第一音频特征向量;根据每路所述语音通道所采集的语音数据的第一音频特征向量,获取所述语音信号的融合音频特征向量;根据预先训练的神经网络对所述融合音频特征向量进行处理,获取与所述语音信号对应的标签序列;其中,所述标签序列为所述语音信号对应的语音单元或文本形成的序列;根据所述标签序列,识别所述语音信号中是否包含预设的唤醒指令。2.如权利要求1所述的语音唤醒方法,其特征在于,所述提取每路所述语音通道所采集的语音数据的第一音频特征向量,包括:分别提取每路所述语音通道所采集的语音数据的声学特征;对每路所述语音通道所采集的语音数据的声学特征,进行可分离卷积处理,获取每路所述语音通道所采集的语音数据的第一音频特征向量。3.如权利要求2所述的设备唤醒方法,其特征在于,所述提取每路所述语音通道所采集的语音数据的声学特征,包括:针对每路语音数据执行如下处理:对所述语音数据进行分帧处理,获取所述语音数据包含的多个语音帧;根据预设的增强系数对每个语音帧进行高频增强处理,获取所述语音帧对应的增强语音数据;根据预设的窗函数分别对每个语音帧对应的增强语音数据进行加窗处理,获得每个语音帧对应的加窗增强语音数据;提取所述每个语音帧对应的加窗增强语音数据的音频特征,并将所述每个语音帧对应的加窗增强语音数据的音频特征确定为所述语音数据的声学特征。4.如权利要求1所述的语音唤醒方法,其特征在于,所述根据每路所述语音通道所采集的语音数据的第一音频特征向量获取所述语音信号的融合音频特征向量,包括:将每路所述语音通道所采集的语音数据的第一音频特征向量进行拼接处理,获取所述语音信号的融合音频特征向量;或者根据每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值,确定所述融合音频特征向量中对应位置的融合特征值。5.如权利要求4所述的语音唤醒方法,其特征在于,所述将每路所述语音通道所采集的语音数据的第一音频特征向量进行拼接处理,获取所述语音信号的融合音频特征向量,包括:基于语音帧在每路语音数据中的时序,将每路所述语音通道所采集的语音数据的第一音频特征向量,按照对应语音帧进行拼接处理,获取所述语音信号的融合音频特征向量。6.如权利要求4所述的语音唤醒方法,其特征在于,所述根据每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值,确定所述融合音频特征向量中对应位置的融合特征值,包括:将每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值相加,获取所述融合音频特征向量中对应位置的融合特征值;或者2CN111933111A权利要求书2/2页将每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值进行加权后相加,获取所述融合音频特征向量中对应位置的融合特征值;或者根据预设函数,将每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值进行函数运算后相加,获取所述融合音频特征向量中对应位置的融合特征值。7.如权利要求5所述的语音唤醒方法,其特征在于,在根据预先训练的神经网络对所述融合音频特征向量进行处理之前,所述方法还包