预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111462756A(43)申请公布日2020.07.28(21)申请号201910047162.3(22)申请日2019.01.18(71)申请人北京猎户星空科技有限公司地址100025北京市朝阳区姚家园南路一号惠通时代广场8号(72)发明人吴本谷宋莎莎(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人黄志华(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)G10L17/24(2013.01)权利要求书2页说明书11页附图5页(54)发明名称声纹识别方法、装置、电子设备及存储介质(57)摘要本发明涉及语音识别技术领域,公开了一种声纹识别方法、装置、电子设备及存储介质,所述方法包括:获取智能设备采集到的输入语音;在输入语音中,确定出预设唤醒词对应的每个状态对应的音频帧;对于预设唤醒词的每个状态,对状态对应的音频帧的声学特征向量取平均,得到状态对应的目标特征向量;将预设唤醒词的各状态对应的目标特征向量作为预先训练好的声纹识别模型的输入,以通过声纹识别模型对输入语音进行声纹识别。本发明实施例提供的技术方案,对用户输入的语音进行降噪处理,使得通过声纹识别模型得到的声纹特征向量能够更好地还原用户的声纹特征,提高识别成功率。CN111462756ACN111462756A权利要求书1/2页1.一种声纹识别方法,其特征在于,包括:获取智能设备采集到的输入语音;在所述输入语音中,确定出预设唤醒词对应的每个状态对应的音频帧;对于所述预设唤醒词的每个状态,对所述状态对应的音频帧的声学特征向量取平均,得到所述状态对应的目标特征向量;将所述预设唤醒词的各状态对应的目标特征向量作为预先训练好的声纹识别模型的输入,以通过所述声纹识别模型对所述输入语音进行声纹识别。2.根据权利要求1所述的方法,其特征在于,获取所述输入语音之后,还包括:将所述输入语音进行分帧处理,得到若干个音频帧;对各个音频帧进行声学特征提取,得到各个音频帧对应的声学特征向量。3.根据权利要求1所述的方法,其特征在于,还包括:根据所述声纹识别模型,对所述输入语音进行声纹识别,得到所述输入语音对应的目标声纹特征向量;将所述目标声纹特征向量与数据库中的声纹特征向量进行比对,确定出所述目标声纹特征向量对应的用户标识,所述数据库中存储有声纹特征向量以及用户标识。4.根据权利要求1所述的方法,其特征在于,还包括:根据所述预设唤醒词对应的每个状态对应的目标特征向量,确定所述输入语音中包含预设唤醒词的置信度;若所述置信度大于预设置信度阈值,则指示唤醒所述智能设备。5.根据权利要求4所述的方法,其特征在于,指示唤醒所述智能设备还包括:根据所述声纹识别模型,对所述输入语音进行声纹识别,得到所述输入语音对应的目标声纹特征向量;将所述目标声纹特征向量与指定用户的声纹特征向量进行比对;在确认所述目标声纹特征向量属于所述指定用户后,指示唤醒所述智能设备。6.根据权利要求1至5中任一所述的方法,其特征在于,所述预设唤醒词的状态的数量根据所述预设唤醒词对应的音素总数或音节总数确定。7.一种声纹识别模型的训练方法,其特征在于,包括:获取已知用户标识的音频数据,所述音频数据中包含预设唤醒词;在所述音频数据中,确定出预设唤醒词对应的每个状态对应的音频帧;对于所述预设唤醒词的每个状态,对所述状态对应的音频帧的声学特征向量取平均,得到所述状态对应的目标特征向量;将所述预设唤醒词的各状态对应的目标特征向量确定为训练数据,将所述音频数据对应的用户标识确定为所述训练数据的训练标签,对声纹识别模型进行训练。8.根据权利要求7所述的方法,其特征在于,在获取所述音频数据之后,还包括:将所述音频数据进行分帧处理,得到若干个音频帧;对各个音频帧进行声学特征提取,得到各个音频帧对应的声学特征向量。9.一种电子设备,包括收发机、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述收发机用于在所述处理器的控制下接收和发送数据,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述方法的步骤。2CN111462756A权利要求书2/2页10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该计算机程序指令被处理器执行时实现权利要求1至8任一项所述方法的步骤。3CN111462756A说明书1/11页声纹识别方法、装置、电子设备及存储介质技术领域[0001]本发明涉及语音识别技术领域,尤其涉及一种声纹识别方法、装置、电子设备及存储介质。背景技术[0002]随着语音识别技术的发展,人机交互也越来越频繁,因此,人们更希望自己使用的设备能“认识”自己,而不是将所有人都当作主人。