预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115064174A(43)申请公布日2022.09.16(21)申请号202210444072.X(22)申请日2022.04.25(71)申请人浙江大华技术股份有限公司地址310051浙江省杭州市滨江区滨安路1187号(72)发明人陈庭威黄景标方瑞东林聚财刘克柱毛亚朋黄威震殷俊(74)专利代理机构深圳市威世博知识产权代理事务所(普通合伙)44280专利代理师何倚雯(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)G10L17/06(2013.01)G10L25/78(2013.01)权利要求书3页说明书13页附图3页(54)发明名称语音验证方法、语音验证模型的训练方法及相关装置(57)摘要本申请公开了一种语音验证方法、语音验证模型的训练方法及相关装置,其中,语音验证方法包括:对测试语音进行第一特征提取,得到测试语音的音频特征,并对目标对象发出的参考语音进行第一特征提取,得到参考语音的音频特征;其中,不同对象所发出语音的音频特征不同;以及对测试语音进行第二特征提取,得到测试语音的鉴别特征;其中,鉴别特征包含用于鉴别发出测试语音的对象是否为活体的特征信息;再基于测试语音的音频特征、参考语音的音频特征和鉴别特征,得到测试语音的验证结果;其中,验证结果包括测试语音是否由目标对象说出。上述方案,能够提高语音验证的准确率。CN115064174ACN115064174A权利要求书1/3页1.一种语音验证方法,其特征在于,包括:对测试语音进行第一特征提取,得到所述测试语音的音频特征,并对目标对象发出的参考语音进行所述第一特征提取,得到所述参考语音的音频特征;其中,不同对象所发出语音的音频特征不同;以及对所述测试语音进行第二特征提取,得到所述测试语音的鉴别特征;其中,所述鉴别特征包含用于鉴别发出所述测试语音的对象是否为活体的特征信息;基于所述测试语音的音频特征、所述参考语音的音频特征和所述鉴别特征,得到所述测试语音的验证结果;其中,所述验证结果包括所述测试语音是否由所述目标对象说出。2.根据权利要求1所述的方法,其特征在于,所述基于所述测试语音的音频特征、所述参考语音的音频特征和所述鉴别特征,得到所述测试语音的验证结果,包括:基于所述测试语音的音频特征和参考语音的音频特征的相似度,得到第一分值,并基于所述鉴别特征,得到第二分值;基于所述第一分值和所述第二分值,得到所述验证结果。3.根据权利要求2所述的方法,其特征在于,所述基于所述鉴别特征,得到第二分值,包括:基于所述鉴别特征进行特征降维,得到发出所述测试语音的对象为活体的可信度;基于所述可信度进行分值映射,得到所述第二分值。4.根据权利要求2所述的方法,其特征在于,所述基于所述第一分值和所述第二分值,得到所述验证结果,包括:基于所述第一分值和所述第二分值的乘积,得到所述测试语音的验证分值;基于所述验证分值与判决门限之间的大小关系,得到所述验证结果。5.根据权利要求2所述的方法,其特征在于,所述第一特征提取由对象识别网络执行,所述第二特征提取由语音鉴别网络执行,所述第二分值基于分值映射网络对所述鉴别特征映射得到,所述对象识别网络、所述语音鉴别网络和所述分值映射网络基于样本数据联合训练得到,且在所述联合训练过程中,固定所述对象识别网络的网络参数,并调整所述语音鉴别网络和所述分值映射网络的网络参数;其中,所述样本数据包括样本测试语音、样本目标对象的样本参考语音和所述样本测试语音的样本验证结果,所述样本验证结果包括所述样本测试语音实际是否由所述样本目标对象说出。6.根据权利要求5所述的方法,其特征在于,所述对象识别网络在所述联合训练之前基于第一样本语音预训练得到,且所述第一样本语音标注有发出所述第一样本语音的样本对象。7.根据权利要求5所述的方法,其特征在于,所述语音鉴别网络在所述联合训练之前基于第二样本语音预训练得到,且所述第二样本语音标注有样本标记,所述样本标记用于表征发出所述第二样本语音的对象是否为活体。8.一种语音验证模型的训练方法,其特征在于,所述语音验证模型包括对象识别网络和语音鉴别网络,所述方法包括:获取样本测试语音、样本目标对象的样本参考语音和所述样本测试语音的样本验证结果;其中,所述样本验证结果包括所述样本测试语音实际是否由所述样本目标对象说出;2CN115064174A权利要求书2/3页基于所述对象识别网络对所述样本测试语音进行第一特征提取,得到所述样本测试语音的样本音频特征,并基于所述对象识别网络对所述样本参考语音进行所述第一特征提取,得到所述样本参考语音的样本音频特征;其中,不同样本对象所发出样本语音的样本音频特征不同;以及基于所述语音鉴别网络对所述样本测试语音进行