预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113948089A(43)申请公布日2022.01.18(21)申请号202010622080.X(22)申请日2020.06.30(71)申请人北京猎户星空科技有限公司地址100025北京市朝阳区姚家园南路一号惠通时代广场8号(72)发明人王岩全李宝祥(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人路晓丹(51)Int.Cl.G10L17/00(2013.01)G10L17/22(2013.01)G10L17/02(2013.01)G10L17/04(2013.01)G10L17/18(2013.01)权利要求书2页说明书17页附图4页(54)发明名称声纹模型训练和声纹识别方法、装置、设备及介质(57)摘要本发明公开了一种声纹模型的训练和声纹识别方法、装置、设备及介质。通过原始声纹模型,确定目标家庭样本集中语音样本中包含的每个语音帧对应的第一声纹向量,将每个第一声纹向量加权后的向量和确定为该语音样本的声纹特征向量,根据该声纹特征向量以及已注册的声纹特征向量,确定第二标识信息,根据第一标识信息和第二标识信息,对原始声纹模型进行训练,从而实现只需根据目标家庭样本集中的语音样本,即可训练出目标家庭对应的声纹模型,节省训练得到声纹模型的时间,由于该声纹模型只需对目标家庭中家庭成员的声纹特征向量进行识别,因此该声纹模型更加小型化。CN113948089ACN113948089A权利要求书1/2页1.一种声纹模型的训练方法,其特征在于,所述方法包括:获取目标家庭样本集中的语音样本以及所述语音样本所归属的家庭成员的第一标识信息;通过原始声纹模型,确定所述语音样本中包含的每个语音帧对应的第一声纹向量,并根据每个第一声纹向量加权后的向量和,确定所述语音样本的声纹特征向量,根据所述语音样本的声纹特征向量以及已注册的声纹特征向量,确定所述语音样本的第二标识信息;根据所述语音样本对应的第一标识信息和第二标识信息,对所述原始声纹模型的参数进行调整,得到所述目标家庭对应的声纹模型。2.根据权利要求1所述的方法,其特征在于,所述根据每个第一声纹向量加权后的向量和,确定所述语音样本的声纹特征向量,包括:通过当前的声纹模型,基于每个第一声纹向量包含的元素的元素值,分别对每个第一声纹向量对应的第一权重值进行迭代更新,根据更新后的每个第一权重值,确定每个第一声纹向量加权后的向量和,并根据每个第一声纹向量加权后的向量和,确定所述语音样本的声纹特征向量。3.根据权利要求2所述的方法,其特征在于,所述基于每个第一声纹向量包含的元素的元素值,分别对每个第一声纹向量对应的第一权重值进行迭代更新,包括:获取当前的声纹模型对应的第一迭代次数;在每次迭代中,对于每个第一声纹向量,根据该第一声纹向量、以及上次迭代确定的该第一声纹向量对应的第一权重值,确定加权后的第一声纹向量;根据每个加权后的第一声纹向量,确定所述语音样本的样本声纹特征向量;对于每个第一声纹向量,根据所述语音样本对应的每个第一声纹向量分别与所述样本声纹特征向量的第一相似度,对该第一声纹向量对应的第一权重值进行更新。4.根据权利要求1或2所述的方法,其特征在于,所述通过原始声纹模型,确定所述语音样本中包含的每个语音帧对应的第一声纹向量,包括:通过当前的声纹模型,获取所述语音样本中包含的每个语音帧对应的中间态声纹向量;针对每个语音帧对应的中间态声纹向量,基于所述语音样本对应的每个中间态声纹向量包含的元素的元素值,对该中间态声纹向量进行迭代更新,将更新后的中间态声纹向量确定为该语音帧对应的第一声纹向量。5.根据权利要求4所述的方法,其特征在于,所述针对每个语音帧对应的中间态声纹向量,基于所述语音样本对应的每个中间态声纹向量包含的元素的元素值,对该中间态声纹向量进行迭代更新,包括:获取当前的声纹模型对应的第二迭代次数;在每次迭代中,针对上次迭代确定的每个中间态声纹向量,确定每个中间态声纹向量分别与该中间态声纹向量的第二相似度,对于每个中间态声纹向量,根据每个第二相似度,确定该中间态声纹向量对应的第二权重值;根据每个中间态声纹向量及其分别对应的第二权重值,确定每个中间态声纹向量加权后的向量和,并根据所述每个中间态声纹向量加权后的向量和,对该中间态声纹向量进行更新。6.一种基于权利要求1-5任一项所述的方法训练得到的声纹模型的声纹识别方法,其特征在于,所述方法包括:2CN113948089A权利要求书2/2页通过预先训练完成的声纹模型,确定待识别语音信息中包含的每个语音帧对应的第二声纹向量,并根据每个第二声纹向量加权后的向量和,确定所述待识别语音信息的声纹特征向量,根据所述待识别语音信息的声纹特征向量以及已注册的声纹特征向量,确