语音唤醒方法、装置、电子设备及计算机存储介质-豆柴文库

语音唤醒方法、装置、电子设备及计算机存储介质.pdf

2023-07-21

10金币

1MB

27页

书生****aa

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共27页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115019774A(43)申请公布日2022.09.06(21)申请号202210761146.2(22)申请日2022.06.29(71)申请人浙江大华技术股份有限公司地址310053浙江省杭州市滨江区滨安路1187号(72)发明人吴人杰方瑞东林聚财王宝俊殷俊史巍黄惠祥岳昌洁(74)专利代理机构北京同达信恒知识产权代理有限公司11291专利代理师张洁(51)Int.Cl.G10L15/00(2013.01)G10L15/01(2013.01)G10L15/08(2006.01)G10L15/22(2006.01)权利要求书5页说明书16页附图5页(54)发明名称语音唤醒方法、装置、电子设备及计算机存储介质(57)摘要本公开提供语音唤醒方法、装置、电子设备及计算机存储介质。用于提高语音唤醒的识别率，降低误唤醒的情况。包括：以第一时长为周期，周期性获取所述第一时长内的语音为待处理语音；基于连续获取的多个待处理语音对应的目标音素，得到多条排列路径；其中，所述目标音素是基于对应的待处理语音的状态似然值数组确定的，且所述状态似然值数组中包含所述待处理语音包含的各基础音素分别在各指定状态下对应的状态似然值，所述目标音素为所述各基础音素中的音素；并基于所述多条排列路径中的目标音素的状态似然值，从所述多个排列路径中确定出候选路径；对所述候选路径进行语音识别，并根据所述候选路径的语音识别的结果确定是否对目标设备进行唤醒。CN115019774ACN115019774A权利要求书1/5页1.一种语音唤醒方法，其特征在于，所述方法包括：以第一时长为周期，周期性获取所述第一时长内的语音为待处理语音；基于连续获取的多个待处理语音对应的目标音素，得到多条排列路径；其中，所述目标音素是基于对应的待处理语音的状态似然值数组确定的，且所述状态似然值数组中包含所述待处理语音包含的各基础音素分别在各指定状态下对应的状态似然值，所述目标音素为所述各基础音素中的音素；并，基于所述多条排列路径中的目标音素的状态似然值，从所述多个排列路径中确定出候选路径；对所述候选路径进行语音识别，并根据所述候选路径的语音识别的结果确定是否对目标设备进行唤醒。2.根据权利要求1所述的方法，其特征在于，所述基于连续获取的多个待处理语音对应的目标音素，得到多条排列路径之前，还包括：针对所述多个待处理语音中的各待处理语音进行如下操作：确定所述待处理语音的状态似然值数组中包含的状态似然值的最大值，并将所述最大值对应的基础音素，确定为所述待处理语音对应的目标音素。3.根据权利要求2所述的方法，其特征在于，所述确定所述待处理语音的状态似然值数组中包含的状态似然值的最大值之前，所述方法还包括：针对所述待处理语音的状态似然值数组中任意一个基础音素的任意一个指定状态，根据所述待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的状态似然值以及所述多个待处理语音的各状态似然值数组中与所述基础音素的指定状态相对应的各状态似然值，得到所述基础音素在所述指定状态下的平滑状态似然值；并，基于各基础音素的各指定状态的平滑状态似然值，得到所述待处理语音对应的平滑后的状态似然值数组。4.根据权利要求3所述的方法，其特征在于，所述根据所述待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的状态似然值以及所述多个待处理语音的各状态似然值数组中与所述基础音素的指定状态相对应的各状态似然值，得到与所述基础音素的指定状态相对应的平滑状态似然值，包括：将所述待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的状态似然值以及与所述多个待处理语音的状态似然值数组中与所述基础音素的指定状态相对应的各状态似然值相加，得到所述基础音素的指定状态的总状态似然值；将所述总状态似然值与各待处理语音的总时长相除，得到所述基础音素的指定状态的平滑状态似然值。5.根据权利要求1所述的方法，其特征在于，所述基于连续获取的多个待处理语音对应的目标音素，得到多条排列路径，包括：针对所述多个待处理语音中的任意两个相邻的待处理语音，将所述两个相邻的待处理语音的目标音素按照获取时间的先后顺序相连接，得到与所述两个相邻的待处理语音相对应的排列路径；基于各相邻的两个待处理语音对应的排列路径，得到所述多条排列路径。6.根据权利要求1所述的方法，其特征在于，所述基于所述多条排列路径中的目标音素2CN115019774A权利要求书2/5页的状态似然值，从所述多个排列路径中确定出候选路径，包括：将所述多条排列路径中概率值最高的排列路径确定为所述候选路径。7.根据权利要求1所述的方法，其特征在于，通过以下方式得到候选路径的语音识别的结果：针对任意一个候选路径，基于所述候选路径的概率值，确定所

相关资料

语音唤醒方法、装置、电子设备及计算机存储介质.pdf

本公开提供语音唤醒方法、装置、电子设备及计算机存储介质。用于提高语音唤醒的识别率，降低误唤醒的情况。包括：以第一时长为周期，周期性获取所述第一时长内的语音为待处理语音；基于连续获取的多个待处理语音对应的目标音素，得到多条排列路径；其中，所述目标音素是基于对应的待处理语音的状态似然值数组确定的，且所述状态似然值数组中包含所述待处理语音包含的各基础音素分别在各指定状态下对应的状态似然值，所述目标音素为所述各基础音素中的音素；并基于所述多条排列路径中的目标音素的状态似然值，从所述多个排列路径中确定出候选路径；对

2023-07-21

1MB

语音唤醒方法、装置、电子设备及存储介质.pdf

本公开提出一种语音唤醒方法、装置、电子设备及存储介质,涉及计算机技术领域。包括:响应于接收到语音唤醒指令,获取所述移动终端的蓝牙连接信息,所述语音唤醒指令包含唤醒词,所述蓝牙连接信息包括蓝牙连接状态和与所述移动终端建立蓝牙连接的目标设备的设备信息;根据所述蓝牙连接状态和所述设备信息,确定是否响应所述语音唤醒指令。由此,可以在移动终端与车辆处于蓝牙连接状态的情况下,移动过终端不响应语音唤醒指令,车辆响应于语音唤醒指令,从而可以避免移动终端与车载终端的协同组网断开,导致协同唤醒失败,进而导致车辆及移动终端同时

2023-04-26

539KB

语音唤醒方法、装置、电子设备以及存储介质.pdf

本公开提供了语音唤醒方法、装置、电子设备、存储介质以及程序产品，涉及人工智能技术领域，尤其涉及语音交互、云计算、智能座舱和车联网等技术领域。具体实现方案为：响应于确定唤醒语音来自目标用户，获取与目标用户相对应的目标唤醒阈值；对唤醒语音进行唤醒识别，得到唤醒识别结果；以及基于唤醒识别结果和目标唤醒阈值，确定唤醒结果，唤醒结果指示了语音交互功能是否被唤醒语音唤醒。

2023-07-24

655KB

语音唤醒方法、装置、电子设备和存储介质.pdf

本申请提出一种语音唤醒方法、装置、电子设备和存储介质。其中该语音唤醒方法包括：通过多路语音通道接收语音信号，提取每路语音通道所采集的语音数据的第一音频特征向量；根据每路语音通道所采集的语音数据的第一音频特征向量，获取语音信号的融合音频特征向量；根据预先训练的神经网络对融合音频特征向量进行处理，获取与语音信号对应的标签序列；其中，标签序列为语音信号对应的语音单元或文本形成的序列；根据标签序列，识别语音信号中是否包含预设的唤醒指令。本申请实施例结合了各自语音通道的音频特征信息，在很大程度上利用了所有语音通道音

2024-01-04

869KB

一种语音唤醒方法、语音唤醒装置以及存储介质.pdf

本申请公开了一种语音唤醒方法、语音唤醒装置以及存储介质，该语音唤醒方法包括：获取声学特征流；基于第一建模单位提取声学特征流的第一状态序列；响应于第一级解码图对第一状态序列的解码结果为预设唤醒词，获取解码出预设唤醒词的解码声学特征；基于第二建模单位提取解码声学特征的第二状态序列；响应于第二级解码图对第二状态序列的解码结果为预设唤醒词，对预设唤醒词关联的语音设备进行唤醒操作。本申请的语音唤醒方法通过构建多种尺度的声学状态序列组合，能够对唤醒词进行二次解码确认，减少误唤醒的发生。

2023-06-11

769KB