预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114203186A(43)申请公布日2022.03.18(21)申请号202010979431.2(22)申请日2020.09.17(71)申请人大众问问(北京)信息科技有限公司地址100098北京市海淀区北三环西路25号27号楼三层3011室(72)发明人王夏鸣(74)专利代理机构北京品源专利代理有限公司11332代理人孟金喆(51)Int.Cl.G10L17/22(2013.01)G10L17/02(2013.01)G10L17/18(2013.01)权利要求书3页说明书10页附图4页(54)发明名称一种声纹注册方法、装置及电子设备(57)摘要本发明实施例公开了一种声纹注册方法、装置及电子设备。其中,声纹注册方法包括:确定待注册的目标用户与语音对话系统对话过程中产生的至少一个语音特征向量;对各语音特征向量进行聚类处理,得到至少一个语音特征向量簇,并在至少一个语音特征向量簇中确定目标语音特征向量簇;当目标语音特征向量簇满足声纹注册条件时,根据目标语音特征向量簇,对目标用户进行声纹注册。本发明实施例的方案,解决了相关技术中声纹注册的过程繁琐的问题,简化了声纹注册的过程,可以实现用户的声纹自动注册。CN114203186ACN114203186A权利要求书1/3页1.一种声纹注册方法,其特征在于,包括:确定待注册的目标用户与语音对话系统对话过程中产生的至少一个语音特征向量;对各所述语音特征向量进行聚类处理,得到至少一个语音特征向量簇,并在至少一个语音特征向量簇中确定目标语音特征向量簇;当所述目标语音特征向量簇满足声纹注册条件时,根据所述目标语音特征向量簇,对所述目标用户进行声纹注册。2.根据权利要求1所述的方法,其特征在于,所述确定用户与语音对话系统过程中产生的至少一个语音特征向量,包括:在所述目标用户与语音对话系统对话过程中获取至少一个声音片段,并确定与所述声音片段对应的语音特征向量;其中,各所述声音片段中包含语音数据。3.根据权利要求2所述的方法,其特征在于,所述在所述目标用户与语音对话系统对话过程中获取至少一个声音片段,包括:在所述目标用户与语音对话系统对话过程中,通过语音活动检测模块对所述目标用户与语音对话系统的对话进行切分,并滤除不包含语音数据的静音段,得到至少一个所述声音片段。4.根据权利要求1所述的方法,其特征在于,对各所述语音特征向量进行聚类处理,得到至少一个语音特征向量簇,包括:依次获取一个语音特征向量作为当前处理向量;如果确定当前存在至少一个语音特征向量簇,则计算所述当前处理向量与各所述语音特征向量簇之间的向量距离;如果根据所述向量距离确定所述当前处理向量与参考语音特征向量簇满足同类条件时,将所述当前处理向量加入至所述参考语音特征向量簇中;如果根据所述向量距离确定所述当前处理向量与任一语音特征向量簇均不满足同类条件时,则建立新的语音特征向量簇,并将所述当前处理向量加入至所述新的语音特征向量簇中;如果确定当前不存在任一语音特征向量簇,则建立新的语音特征向量簇,并将所述当前处理向量加入至所述新的语音特征向量簇中。5.根据权利要求1所述的方法,其特征在于,在至少一个语音特征向量簇中确定目标语音特征向量簇,包括:统计各所述语音特征向量簇包含的语音特征向量的数量,并确定包含语音特征向量最多的语音特征向量簇为所述目标语音特征向量簇。6.根据权利要求1所述的方法,其特征在于,所述当所述目标语音特征向量簇满足声纹注册条件时,根据所述目标语音特征向量簇,对所述目标用户进行声纹注册,包括:当所述目标语音特征向量簇所包含的语音特征向量的数量大于设定阈值时,将所述目标语音特征向量簇包含的各语音特征向量输入至声纹模型中进行训练,得到与所述目标用户对应的声纹模型。7.根据权利要求6所述的方法,其特征在于,在所述根据所述目标语音特征向量簇,对所述目标用户进行声纹注册之后,所述方法还包括:当与所述目标用户对应的所述声纹模型满足更新条件时,重新确定所述声纹模型,以2CN114203186A权利要求书2/3页实现对所述目标用户的声纹库进行更新。8.根据权利要求7所述的方法,其特征在于,所述当与所述目标用户对应的所述声纹模型满足更新条件时,重新确定所述声纹模型,包括:继续确定所述目标用户与语音对话系统对话过程中产生的至少一个新的语音特征向量,并对各所述新的语音特征向量进行聚类;当所述声纹模型确定目标新的语音特征向量为非注册用户,且所述目标新的语音特征向量与目标语音特征向量簇的向量距离大于或者等于设定阈值时,将所述目标新的语音特征向量加入至所述目标语音特征向量簇中,得到新的目标语音特征向量簇;根据所述新的目标语音特征向量簇确定与所述目标用户对应的声纹模型,以实现对所述目