预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108958810A(43)申请公布日2018.12.07(21)申请号201810133615.X(22)申请日2018.02.09(71)申请人北京猎户星空科技有限公司地址100041北京市石景山区实兴大街30号院3号楼2层A-2570房间(72)发明人吴本谷李想陈君宇(74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙)11413代理人张聪聪马敬(51)Int.Cl.G06F9/4401(2018.01)G06F21/32(2013.01)G10L15/08(2006.01)G10L15/22(2006.01)G10L17/00(2013.01)权利要求书2页说明书11页附图4页(54)发明名称一种基于声纹的用户识别方法、装置及设备(57)摘要本发明实施例提供了一种基于声纹的用户识别方法、装置及设备,该方法包括:获取待识别用户的语音信号,作为待识别语音信号;利用预先训练得到的唤醒模型,识别待识别语音信号中的唤醒词;获取包含所述唤醒词的语音片段;利用预先训练得到的声纹模型,对所述语音片段进行声纹识别,根据识别结果,确定所述待识别用户的身份信息。可见,本方案中,智能设备在接收到唤醒词后识别用户身份,进而也就可以根据用户身份,为不同的用户提供个性化服务。CN108958810ACN108958810A权利要求书1/2页1.一种基于声纹的用户识别方法,其特征在于,应用于智能设备,所述方法包括:获取待识别用户的语音信号,作为待识别信号;利用预先训练得到的唤醒模型,识别所述待识别语音信号中的唤醒词;获取包含所述唤醒词的语音片段;利用预先训练得到的声纹模型,对所述语音片段进行声纹识别,根据识别结果,确定所述待识别用户的身份信息。2.根据权利要求1所述的方法,其特征在于,采用如下步骤建立声纹模型:获取注册用户的语音信号,作为注册语音信号;其中,所述注册语音信号中包含所述唤醒词;根据所述注册语音信号,建立声纹模型;存储建立的声纹模型及与所述声纹模型对应的注册用户的身份信息。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述智能设备从待唤醒状态切换为唤醒状态。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:播放与识别出的用户身份信息对应的音频信息。5.根据权利要求1所述的方法,其特征在于,在确定所述待识别用户的身份信息之后,还包括:从所述待识别语音信号中识别出语音指令;根据所述待识别用户的身份信息,播放与所述语音指令相对应的音频信息。6.根据权利要求1所述的方法,其特征在于,所述利用预先训练得到的唤醒模型,识别所述待识别语音信号中的唤醒词,包括:提取所述待识别语音信号的特征向量,将所述待识别语音信号的特征向量输入预先训练得到的唤醒模型中;在所述唤醒模型中,根据所述待识别语音信号的特征向量,识别所述待识别语音信号中是否包含唤醒词;所述利用预先训练得到的声纹模型,对所述语音片段进行声纹识别,包括:将所述语音片段的特征向量输入预先训练得到的声纹模型;在所述声纹模型中,对所述语音片段的特征向量进行声纹识别。7.一种基于声纹的用户识别装置,其特征在于,应用于智能设备,所述装置包括:语音信号获取模块,用于获取待识别用户的语音信号,作为待识别信号;唤醒模块,用于利用预先训练得到的唤醒模型,识别所述待识别语音信号中的唤醒词;语音片段获取模块,用于获取包含所述唤醒词的语音片段;声纹识别模块,用于利用预先训练得到的声纹模型,对所述语音片段进行声纹识别,根据识别结果,确定所述待识别用户的身份信息。8.根据权利要求7所述的装置,其特征在于,采用如下装置建立声纹模型:注册语音获取模块,用于获取注册用户的语音信号,作为注册语音信号;其中,所述注册语音信号中包含所述唤醒词;声纹模型建立模块,用于根据所述注册语音信号,建立声纹模型;身份信息存储模块,用于存储建立的声纹模型及与所述声纹模型对应的注册用户的身2CN108958810A权利要求书2/2页份信息。9.根据权利要求7所述的装置,其特征在于,所述装置还包括:状态切换模块,用于将所述智能设备从待唤醒状态切换为唤醒状态。10.根据权利要求7所述的装置,其特征在于,所述装置还包括:音频播放模块,用于播放与识别出的用户身份信息对应的音频信息。11.根据权利要求7所述的装置,其特征在于,所述装置还包括:指令响应模块,用于从所述待识别语音信号中识别出语音指令;根据所述待识别用户的身份信息,播放与所述语音指令相对应的音频信息。12.根据权利要求7所述的装置,其特征在于,所述唤醒模块,包括:特征向量提取子模块,用于提取所述待识别语音信号的特征向量,将所述待识别语音信号的特征向量输入预先训练得到的唤醒模型中;唤醒词识别子模块,用于