预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115762530A(43)申请公布日2023.03.07(21)申请号202211349554.3G10L15/01(2013.01)(22)申请日2022.10.31(71)申请人招联消费金融有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)(72)发明人余治伦巴莉芳徐伟林昊王福海梁毅(74)专利代理机构华进联合专利商标代理有限公司44224专利代理师曾情(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)G10L17/14(2013.01)权利要求书2页说明书17页附图5页(54)发明名称声纹模型训练方法、装置、计算机设备和存储介质(57)摘要本申请涉及一种声纹模型训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将训练集中的训练语音特征输入初始声纹模型,得到训练声纹特征和声纹质量分数;基于声纹质量分数构建夹角调节值;基于夹角调节值对训练声纹特征和目标类别之间的特征夹角进行调整得到第一夹角,计算训练声纹特征和其他候选类别之间的特征夹角,得到各个第二夹角;基于各个第一夹角、第二夹角和声纹质量分数得到目标损失;基于目标损失调整初始声纹模型的模型参数得到中间声纹模型,将中间声纹模型作为初始声纹模型,返回获取训练集的步骤执行直至满足收敛条件,得到目标声纹模型。采用本方法能够提高声纹识别的准确性。CN115762530ACN115762530A权利要求书1/2页1.一种声纹模型训练方法,其特征在于,所述方法包括:获取训练集;所述训练集包括多个训练语音样本对应的训练语音特征和目标类别;将所述训练集中的训练语音特征输入初始声纹模型,得到各个训练语音样本分别对应的训练声纹特征和声纹质量分数;所述初始声纹模型包括多个候选类别分别对应的类别声纹特征;基于训练语音样本对应的声纹质量分数构建训练语音样本对应的夹角调节值;基于同一训练语音样本对应的夹角调节值,对目标类别对应的类别声纹特征和训练声纹特征之间的特征夹角进行调整,得到各个训练语音样本分别对应的第一夹角,计算训练声纹特征和其他候选类别对应的类别声纹特征之间的特征夹角,得到各个训练语音样本分别对应的第二夹角;基于各个训练语音样本对应的第一夹角、第二夹角和声纹质量分数得到目标损失;基于所述目标损失调整所述初始声纹模型的模型参数,得到中间声纹模型,将中间声纹模型作为初始声纹模型,返回所述获取训练集的步骤执行,直至满足收敛条件,得到目标声纹模型。2.根据权利要求1所述的方法,其特征在于,所述将所述训练集中的训练语音特征输入初始声纹模型,得到各个训练语音样本分别对应的训练声纹特征和声纹质量分数,包括:将训练语音样本对应的训练语音特征输入初始声纹模型,得到训练语音样本对应的训练声纹特征;基于训练声纹特征的特征长度,确定训练语音样本对应的声纹质量分数。3.根据权利要求1所述的方法,其特征在于,所述基于各个训练语音样本对应的第一夹角、第二夹角和声纹质量分数得到目标损失,包括:基于同一训练语音样本对应的第一夹角和第二夹角,得到各个训练语音样本在对应的目标类别下的目标概率;基于同一训练语音样本对应的夹角调节值和目标概率,得到各个训练语音样本分别对应的初始损失;基于各个训练语音样本分别对应的声纹质量分数和初始损失,得到所述目标损失。4.根据权利要求3所述的方法,其特征在于,所述基于同一训练语音样本对应的第一夹角和第二夹角,得到各个训练语音样本在对应的目标类别下的目标概率,包括:基于训练语音样本对应的第一夹角,计算训练语音样本对应的正相似度,基于训练语音样本对应的第二夹角,计算训练语音样本对应的负相似度;融合同一训练语音样本对应的正相似度和负相似度,得到各个训练语音样本分别对应的总相似度;基于同一训练语音样本对应的正相似度和总相似度的比值,得到各个训练语音样本在对应的目标类别下的目标概率。5.根据权利要求3所述的方法,其特征在于,所述基于同一训练语音样本对应的夹角调节值和目标概率,得到各个训练语音样本分别对应的初始损失,包括:对训练语音样本对应的目标概率进行对数处理,得到基础损失;基于训练语音样本对应的目标概率和夹角调节值,得到基础损失对应的损失权重;所述损失权重与目标概率、夹角调节值呈负相关;2CN115762530A权利要求书2/2页基于损失权重,对所述基础损失进行调整,得到训练语音样本对应的初始损失。6.根据权利要求3所述的方法,其特征在于,所述基于各个训练语音样本分别对应的声纹质量分数和初始损失,得到所述目标损失,包括:基于训练语音样本对应的声纹质量分数,得到对应的初始损失的损失调整值;基于损失调整值,对初始损失进行调整,得