预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113870863A(43)申请公布日2021.12.31(21)申请号202111181601.3(22)申请日2021.10.11(71)申请人中国电信股份有限公司地址100033北京市西城区金融大街31号(72)发明人沈浩赵德欣王磊曾然然林悦(74)专利代理机构北京律智知识产权代理有限公司11438代理人王辉阚梓瑄(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)G10L17/14(2013.01)G10L17/18(2013.01)权利要求书3页说明书14页附图9页(54)发明名称声纹识别方法及装置、存储介质及电子设备(57)摘要本公开提供一种声纹识别方法及装置、存储介质及电子设备;涉及人工智能技术领域。该方法包括:确定候选单元结构;构建神经网络模型并训练;向神经网络模型中添加掩码模块,构建生成器;将训练好的神经网络模型作为基线网络,通过基线网络、生成器和判别器构建生成对抗网络模型并训练;根据训练好的生成对抗网络模型,确定待裁剪的中间状态节点并裁剪;对裁剪后神经网络模型重新训练后,提取待识别目标的声纹特征;基于相似度,确定声纹识别结果。本公开能够减少现有神经网络架构搜索过程中耗费计算资源,且搜索到的网络结构中网络参数数量大,运算量大的问题。CN113870863ACN113870863A权利要求书1/3页1.一种声纹识别方法,其特征在于,包括:确定候选单元结构;基于所述候选单元结构,构建神经网络模型并对所述神经网络模型进行训练;向所述神经网络模型中添加掩码模块,构建对应的生成器;将训练好的神经网络模型作为基线网络,通过所述基线网络、所述生成器和判别器构建生成对抗网络模型,并对所述生成对抗网络模型进行训练;根据训练好的生成对抗网络模型,确定待裁剪的中间状态节点;将所述神经网络模型中的待裁剪的中间状态节点进行裁剪,得到精简结构神经网络模型;对所述精简结构神经网络模型进行重新训练,采用训练好的精简结构神经网络模型提取待识别目标的声纹特征,得到待识别目标的声纹特征向量;根据所述待识别目标的声纹特征向量与带标签的声纹特征向量之间的相似度,确定声纹识别结果。2.根据权利要求1所述的声纹识别方法,其特征在于,所述确定候选单元结构;基于所述候选单元结构,构建神经网络模型,包括:利用基于梯度的神经网络架构搜索方法搜索得到候选单元结构,即Normal单元和Reduction单元;根据设置的网络单元数量和堆叠规则,对所述Normal单元和Reduction单元进行交替堆叠,形成神经网络主体架构;在所述神经网络主体架构之后设置分类层,得到神经网络模型。3.根据权利要求2所述的声纹识别方法,其特征在于,所述方法还包括:在所述神经网络主体架构与分类层之间顺序设置池化层和全连接层。4.根据权利要求1所述的声纹识别方法,其特征在于,所述向所述神经网络模型中添加掩码模块,构建对应的生成器,包括:向所述神经网络模型的中间状态节点添加掩码模块,以使中间状态节点的特征值中加入稀疏掩码值,形成生成器。5.根据权利要求4所述的声纹识别方法,其特征在于,所述通过所述基线网络、所述生成器和判别器构建生成对抗网络模型,包括:将基线网络的分类层预测值标记为真标签;将生成器的分类层预测值标记为假标签;将多层感知器网络作为判别器;利用判别器对基线网络的输出与生成器的输出进行二分类学习,形成生成对抗网络模型。6.根据权利要求5所述的声纹识别方法,其特征在于,所述对所述生成对抗网络模型进行训练,包括:固定所述生成器与掩码模块的参数值,采用训练数据训练所述判别器,以更新判别器的参数;固定更新后的判别器的参数,采用训练数据训练所述生成器,以更新生成器与掩码模块的参数。7.根据权利要求4所述的声纹识别方法,其特征在于,所述根据训练好的生成对抗网络2CN113870863A权利要求书2/3页模型,确定待裁剪的中间状态节点,包括:根据训练好的生成对抗网络模型的中间状态节点的掩码模块的掩码值,确定待裁剪的中间状态节点。8.根据权利要求1所述的声纹识别方法,其特征在于,所述将所述神经网络模型中的待裁剪的中间状态节点进行裁剪,包括:将每个单元的待裁剪的中间状态节点、该中间状态节点与前置节点连接的边、该中间状态节点与后置节点连接的边分别进行裁剪,形成对应的新的单元结构;采用新的单元结构按神经网络模型的网络架构重新组合,得到精简结构神经网络模型。9.根据权利要求1所述的声纹识别方法,其特征在于,所述对精简结构神经网络模型进行重新训练,包括:获取语音训练数据;其中,语音训练数据包含从语音数据中提取的语谱图及其标签;采用所述语音训练数据对所述精简结构神经网络模型进行网络参数训练,训