语音验证方法、语音验证模型的训练方法及相关装置-豆柴文库

语音验证方法、语音验证模型的训练方法及相关装置.pdf

2023-07-21

10金币

662KB

20页

猫巷****觅蓉

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共20页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115064174A(43)申请公布日2022.09.16(21)申请号202210444072.X(22)申请日2022.04.25(71)申请人浙江大华技术股份有限公司地址310051浙江省杭州市滨江区滨安路1187号(72)发明人陈庭威黄景标方瑞东林聚财刘克柱毛亚朋黄威震殷俊(74)专利代理机构深圳市威世博知识产权代理事务所(普通合伙)44280专利代理师何倚雯(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)G10L17/06(2013.01)G10L25/78(2013.01)权利要求书3页说明书13页附图3页(54)发明名称语音验证方法、语音验证模型的训练方法及相关装置(57)摘要本申请公开了一种语音验证方法、语音验证模型的训练方法及相关装置，其中，语音验证方法包括：对测试语音进行第一特征提取，得到测试语音的音频特征，并对目标对象发出的参考语音进行第一特征提取，得到参考语音的音频特征；其中，不同对象所发出语音的音频特征不同；以及对测试语音进行第二特征提取，得到测试语音的鉴别特征；其中，鉴别特征包含用于鉴别发出测试语音的对象是否为活体的特征信息；再基于测试语音的音频特征、参考语音的音频特征和鉴别特征，得到测试语音的验证结果；其中，验证结果包括测试语音是否由目标对象说出。上述方案，能够提高语音验证的准确率。CN115064174ACN115064174A权利要求书1/3页1.一种语音验证方法，其特征在于，包括：对测试语音进行第一特征提取，得到所述测试语音的音频特征，并对目标对象发出的参考语音进行所述第一特征提取，得到所述参考语音的音频特征；其中，不同对象所发出语音的音频特征不同；以及对所述测试语音进行第二特征提取，得到所述测试语音的鉴别特征；其中，所述鉴别特征包含用于鉴别发出所述测试语音的对象是否为活体的特征信息；基于所述测试语音的音频特征、所述参考语音的音频特征和所述鉴别特征，得到所述测试语音的验证结果；其中，所述验证结果包括所述测试语音是否由所述目标对象说出。2.根据权利要求1所述的方法，其特征在于，所述基于所述测试语音的音频特征、所述参考语音的音频特征和所述鉴别特征，得到所述测试语音的验证结果，包括：基于所述测试语音的音频特征和参考语音的音频特征的相似度，得到第一分值，并基于所述鉴别特征，得到第二分值；基于所述第一分值和所述第二分值，得到所述验证结果。3.根据权利要求2所述的方法，其特征在于，所述基于所述鉴别特征，得到第二分值，包括：基于所述鉴别特征进行特征降维，得到发出所述测试语音的对象为活体的可信度；基于所述可信度进行分值映射，得到所述第二分值。4.根据权利要求2所述的方法，其特征在于，所述基于所述第一分值和所述第二分值，得到所述验证结果，包括：基于所述第一分值和所述第二分值的乘积，得到所述测试语音的验证分值；基于所述验证分值与判决门限之间的大小关系，得到所述验证结果。5.根据权利要求2所述的方法，其特征在于，所述第一特征提取由对象识别网络执行，所述第二特征提取由语音鉴别网络执行，所述第二分值基于分值映射网络对所述鉴别特征映射得到，所述对象识别网络、所述语音鉴别网络和所述分值映射网络基于样本数据联合训练得到，且在所述联合训练过程中，固定所述对象识别网络的网络参数，并调整所述语音鉴别网络和所述分值映射网络的网络参数；其中，所述样本数据包括样本测试语音、样本目标对象的样本参考语音和所述样本测试语音的样本验证结果，所述样本验证结果包括所述样本测试语音实际是否由所述样本目标对象说出。6.根据权利要求5所述的方法，其特征在于，所述对象识别网络在所述联合训练之前基于第一样本语音预训练得到，且所述第一样本语音标注有发出所述第一样本语音的样本对象。7.根据权利要求5所述的方法，其特征在于，所述语音鉴别网络在所述联合训练之前基于第二样本语音预训练得到，且所述第二样本语音标注有样本标记，所述样本标记用于表征发出所述第二样本语音的对象是否为活体。8.一种语音验证模型的训练方法，其特征在于，所述语音验证模型包括对象识别网络和语音鉴别网络，所述方法包括：获取样本测试语音、样本目标对象的样本参考语音和所述样本测试语音的样本验证结果；其中，所述样本验证结果包括所述样本测试语音实际是否由所述样本目标对象说出；2CN115064174A权利要求书2/3页基于所述对象识别网络对所述样本测试语音进行第一特征提取，得到所述样本测试语音的样本音频特征，并基于所述对象识别网络对所述样本参考语音进行所述第一特征提取，得到所述样本参考语音的样本音频特征；其中，不同样本对象所发出样本语音的样本音频特征不同；以及基于所述语音鉴别网络对所述样本测试语音进行

相关资料

语音验证方法、语音验证模型的训练方法及相关装置.pdf

本申请公开了一种语音验证方法、语音验证模型的训练方法及相关装置，其中，语音验证方法包括：对测试语音进行第一特征提取，得到测试语音的音频特征，并对目标对象发出的参考语音进行第一特征提取，得到参考语音的音频特征；其中，不同对象所发出语音的音频特征不同；以及对测试语音进行第二特征提取，得到测试语音的鉴别特征；其中，鉴别特征包含用于鉴别发出测试语音的对象是否为活体的特征信息；再基于测试语音的音频特征、参考语音的音频特征和鉴别特征，得到测试语音的验证结果；其中，验证结果包括测试语音是否由目标对象说出。上述方案，能够

2023-07-21

662KB

语音信息处理及验证模型训练方法、装置、设备及介质.pdf

本发明提供了一种语音信息的处理及验证模型的训练方法、装置、设备及介质。基于解码网络获取智能设备采集的语音信息对应的第一语音元素序列，若该第一语音元素序列与预先配置的任一指令语音元素序列匹配，则基于第一语音元素序列，确定第一组合向量，若通过预先训练完成的验证模型，根据第一组合向量，确定该语音信息被正确识别，控制智能设备执行匹配的指令语音元素序列对应的指令词对应的操作。由于在基于解码网络对语音信息进行了识别之后，又通过预先训练完成的验证模型对该语音信息进一步识别，以判断解码是否正确，避免了由于词间干扰、误识别

2024-01-04

629KB

语音内容检测方法、模型训练方法及相关装置.pdf

本申请提出一种语音内容检测方法、模型训练方法、装置、电子设备及存储介质，该方法包括：将目标语音的音频数据以及所述目标语音对应的视频数据，输入预先训练的多模态音频帧分类网络，得到对所述目标语音的各个音频帧的分类结果；其中，所述目标语音对应的视频数据中包含所述目标语音的说话人的面部影像；所述多模态音频帧分类网络，是与辅助训练网络联合训练得到的、用于将音频帧分类为语音帧或非语音帧的神经网络；在所述联合训练过程中，所述辅助训练网络以语音训练样本的文本标签为训练标签，对语音训练样本进行语音内容识别训练。上述方法能够

2023-07-21

731KB

语音降噪的模型训练方法、语音降噪方法、装置及介质.pdf

本申请公开了一种语音降噪的模型训练方法、语音降噪方法、装置及介质，属于语音编解码技术领域。该方法包括对预先获取的纯净语音与噪声进行声音混合，获取混合语音；对纯净语音与混合语音进行特征提取，获取理想子带增益与混合语音对应的倒谱系数；以及利用理想子带增益与倒谱系数对预设的神经网络进行训练，获取语音降噪模型。本申请提供一种语音降噪模型，通过将该语音降噪模型插入蓝牙编码器中，在编码过程中实现语音降噪的目的；在语音降噪的过程中，利用蓝牙编码器自身的时频转换模块获取谱系数，再进行后续的降噪步骤，使得本方案的降噪过程达

2023-07-21

660KB

语音降噪模型的训练方法、语音评分方法、装置及介质.pdf

本申请提供了一种语音降噪模型的训练方法、装置、电子设备及存储介质；语音降噪模型包括：噪音处理层，发音差异处理层和内容差异处理层，方法包括：通过噪音处理层，对语音样本进行降噪处理，得到目标语音样本；通过发音差异处理层，对目标语音样本进行发音评分的预测，得到发音预测结果，该发音预测结果，用于指示目标语音样本与语音样本对应的参考发音间的发音相似度；通过内容差异处理层，确定目标语音样本的内容与语音样本的内容间的内容差异；基于发音预测结果以及内容差异，更新语音降噪模型的模型参数，以得到训练完成的语音降噪模型；通过本

2023-07-24

1.2MB