语音唤醒方法、装置、电子设备和存储介质-豆柴文库

语音唤醒方法、装置、电子设备和存储介质.pdf

2024-01-04

10金币

869KB

23页

猫巷****傲柏

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共23页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111933111A(43)申请公布日2020.11.13(21)申请号202010809091.9(22)申请日2020.08.12(71)申请人北京猎户星空科技有限公司地址100026北京市朝阳区工人体育场北甲二号盈科中心东侧裙楼三层(72)发明人吕安超李家魁陈都李宝祥(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人张大威(51)Int.Cl.G10L15/02(2006.01)G10L15/16(2006.01)G10L15/22(2006.01)G10L15/26(2006.01)权利要求书2页说明书15页附图5页(54)发明名称语音唤醒方法、装置、电子设备和存储介质(57)摘要本申请提出一种语音唤醒方法、装置、电子设备和存储介质。其中该语音唤醒方法包括：通过多路语音通道接收语音信号，提取每路语音通道所采集的语音数据的第一音频特征向量；根据每路语音通道所采集的语音数据的第一音频特征向量，获取语音信号的融合音频特征向量；根据预先训练的神经网络对融合音频特征向量进行处理，获取与语音信号对应的标签序列；其中，标签序列为语音信号对应的语音单元或文本形成的序列；根据标签序列，识别语音信号中是否包含预设的唤醒指令。本申请实施例结合了各自语音通道的音频特征信息，在很大程度上利用了所有语音通道音频的特征信息，可以提高唤醒词识别的准确率。CN111933111ACN111933111A权利要求书1/2页1.一种语音唤醒方法，其特征在于，包括：通过多路语音通道接收语音信号，提取每路所述语音通道所采集的语音数据的第一音频特征向量；根据每路所述语音通道所采集的语音数据的第一音频特征向量，获取所述语音信号的融合音频特征向量；根据预先训练的神经网络对所述融合音频特征向量进行处理，获取与所述语音信号对应的标签序列；其中，所述标签序列为所述语音信号对应的语音单元或文本形成的序列；根据所述标签序列，识别所述语音信号中是否包含预设的唤醒指令。2.如权利要求1所述的语音唤醒方法，其特征在于，所述提取每路所述语音通道所采集的语音数据的第一音频特征向量，包括：分别提取每路所述语音通道所采集的语音数据的声学特征；对每路所述语音通道所采集的语音数据的声学特征，进行可分离卷积处理，获取每路所述语音通道所采集的语音数据的第一音频特征向量。3.如权利要求2所述的设备唤醒方法，其特征在于，所述提取每路所述语音通道所采集的语音数据的声学特征，包括：针对每路语音数据执行如下处理：对所述语音数据进行分帧处理，获取所述语音数据包含的多个语音帧；根据预设的增强系数对每个语音帧进行高频增强处理，获取所述语音帧对应的增强语音数据；根据预设的窗函数分别对每个语音帧对应的增强语音数据进行加窗处理，获得每个语音帧对应的加窗增强语音数据；提取所述每个语音帧对应的加窗增强语音数据的音频特征，并将所述每个语音帧对应的加窗增强语音数据的音频特征确定为所述语音数据的声学特征。4.如权利要求1所述的语音唤醒方法，其特征在于，所述根据每路所述语音通道所采集的语音数据的第一音频特征向量获取所述语音信号的融合音频特征向量，包括：将每路所述语音通道所采集的语音数据的第一音频特征向量进行拼接处理，获取所述语音信号的融合音频特征向量；或者根据每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值，确定所述融合音频特征向量中对应位置的融合特征值。5.如权利要求4所述的语音唤醒方法，其特征在于，所述将每路所述语音通道所采集的语音数据的第一音频特征向量进行拼接处理，获取所述语音信号的融合音频特征向量，包括：基于语音帧在每路语音数据中的时序，将每路所述语音通道所采集的语音数据的第一音频特征向量，按照对应语音帧进行拼接处理，获取所述语音信号的融合音频特征向量。6.如权利要求4所述的语音唤醒方法，其特征在于，所述根据每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值，确定所述融合音频特征向量中对应位置的融合特征值，包括：将每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值相加，获取所述融合音频特征向量中对应位置的融合特征值；或者2CN111933111A权利要求书2/2页将每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值进行加权后相加，获取所述融合音频特征向量中对应位置的融合特征值；或者根据预设函数，将每路所述语音通道所采集的语音数据的第一音频特征向量中相同位置的特征值进行函数运算后相加，获取所述融合音频特征向量中对应位置的融合特征值。7.如权利要求5所述的语音唤醒方法，其特征在于，在根据预先训练的神经网络对所述融合音频特征向量进行处理之前，所述方法还包

相关资料

语音唤醒方法、装置、电子设备和存储介质.pdf

本申请提出一种语音唤醒方法、装置、电子设备和存储介质。其中该语音唤醒方法包括：通过多路语音通道接收语音信号，提取每路语音通道所采集的语音数据的第一音频特征向量；根据每路语音通道所采集的语音数据的第一音频特征向量，获取语音信号的融合音频特征向量；根据预先训练的神经网络对融合音频特征向量进行处理，获取与语音信号对应的标签序列；其中，标签序列为语音信号对应的语音单元或文本形成的序列；根据标签序列，识别语音信号中是否包含预设的唤醒指令。本申请实施例结合了各自语音通道的音频特征信息，在很大程度上利用了所有语音通道音

2024-01-04

869KB

语音唤醒方法、装置、电子设备及存储介质.pdf

本公开提出一种语音唤醒方法、装置、电子设备及存储介质,涉及计算机技术领域。包括:响应于接收到语音唤醒指令,获取所述移动终端的蓝牙连接信息,所述语音唤醒指令包含唤醒词,所述蓝牙连接信息包括蓝牙连接状态和与所述移动终端建立蓝牙连接的目标设备的设备信息;根据所述蓝牙连接状态和所述设备信息,确定是否响应所述语音唤醒指令。由此,可以在移动终端与车辆处于蓝牙连接状态的情况下,移动过终端不响应语音唤醒指令,车辆响应于语音唤醒指令,从而可以避免移动终端与车载终端的协同组网断开,导致协同唤醒失败,进而导致车辆及移动终端同时

2023-04-26

539KB

语音唤醒方法、装置、电子设备以及存储介质.pdf

本公开提供了语音唤醒方法、装置、电子设备、存储介质以及程序产品，涉及人工智能技术领域，尤其涉及语音交互、云计算、智能座舱和车联网等技术领域。具体实现方案为：响应于确定唤醒语音来自目标用户，获取与目标用户相对应的目标唤醒阈值；对唤醒语音进行唤醒识别，得到唤醒识别结果；以及基于唤醒识别结果和目标唤醒阈值，确定唤醒结果，唤醒结果指示了语音交互功能是否被唤醒语音唤醒。

2023-07-24

655KB

语音唤醒方法、装置、电子设备及计算机存储介质.pdf

本公开提供语音唤醒方法、装置、电子设备及计算机存储介质。用于提高语音唤醒的识别率，降低误唤醒的情况。包括：以第一时长为周期，周期性获取所述第一时长内的语音为待处理语音；基于连续获取的多个待处理语音对应的目标音素，得到多条排列路径；其中，所述目标音素是基于对应的待处理语音的状态似然值数组确定的，且所述状态似然值数组中包含所述待处理语音包含的各基础音素分别在各指定状态下对应的状态似然值，所述目标音素为所述各基础音素中的音素；并基于所述多条排列路径中的目标音素的状态似然值，从所述多个排列路径中确定出候选路径；对

2023-07-21

1MB

一种语音唤醒方法、语音唤醒装置以及存储介质.pdf

本申请公开了一种语音唤醒方法、语音唤醒装置以及存储介质，该语音唤醒方法包括：获取声学特征流；基于第一建模单位提取声学特征流的第一状态序列；响应于第一级解码图对第一状态序列的解码结果为预设唤醒词，获取解码出预设唤醒词的解码声学特征；基于第二建模单位提取解码声学特征的第二状态序列；响应于第二级解码图对第二状态序列的解码结果为预设唤醒词，对预设唤醒词关联的语音设备进行唤醒操作。本申请的语音唤醒方法通过构建多种尺度的声学状态序列组合，能够对唤醒词进行二次解码确认，减少误唤醒的发生。

2023-06-11

769KB