语音验证方法、语音验证模型的训练方法及相关装置.pdf
猫巷****觅蓉
亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音验证方法、语音验证模型的训练方法及相关装置.pdf
本申请公开了一种语音验证方法、语音验证模型的训练方法及相关装置,其中,语音验证方法包括:对测试语音进行第一特征提取,得到测试语音的音频特征,并对目标对象发出的参考语音进行第一特征提取,得到参考语音的音频特征;其中,不同对象所发出语音的音频特征不同;以及对测试语音进行第二特征提取,得到测试语音的鉴别特征;其中,鉴别特征包含用于鉴别发出测试语音的对象是否为活体的特征信息;再基于测试语音的音频特征、参考语音的音频特征和鉴别特征,得到测试语音的验证结果;其中,验证结果包括测试语音是否由目标对象说出。上述方案,能够
语音信息处理及验证模型训练方法、装置、设备及介质.pdf
本发明提供了一种语音信息的处理及验证模型的训练方法、装置、设备及介质。基于解码网络获取智能设备采集的语音信息对应的第一语音元素序列,若该第一语音元素序列与预先配置的任一指令语音元素序列匹配,则基于第一语音元素序列,确定第一组合向量,若通过预先训练完成的验证模型,根据第一组合向量,确定该语音信息被正确识别,控制智能设备执行匹配的指令语音元素序列对应的指令词对应的操作。由于在基于解码网络对语音信息进行了识别之后,又通过预先训练完成的验证模型对该语音信息进一步识别,以判断解码是否正确,避免了由于词间干扰、误识别
语音内容检测方法、模型训练方法及相关装置.pdf
本申请提出一种语音内容检测方法、模型训练方法、装置、电子设备及存储介质,该方法包括:将目标语音的音频数据以及所述目标语音对应的视频数据,输入预先训练的多模态音频帧分类网络,得到对所述目标语音的各个音频帧的分类结果;其中,所述目标语音对应的视频数据中包含所述目标语音的说话人的面部影像;所述多模态音频帧分类网络,是与辅助训练网络联合训练得到的、用于将音频帧分类为语音帧或非语音帧的神经网络;在所述联合训练过程中,所述辅助训练网络以语音训练样本的文本标签为训练标签,对语音训练样本进行语音内容识别训练。上述方法能够
语音转换模型训练方法、语音转换方法及装置、设备.pdf
本申请涉及语音处理技术领域,提供了一种语音转换模型训练方法、语音转换方法及装置、设备,语音转换模型训练方法包括:获取第一说话者说话的第一语音音频样本和第二语音音频样本、第二说话者说话的第三语音音频样本,并将其输入到语音转换模型得到对应的第一说话人特征向量、第二说话人特征向量以及第三说话人特征向量,确定第一说话人特征向量与第二说话人特征向量之间的第一相似度值,第三说话人特征向量与第一说话人特征向量或者第二说话人特征向量之间的第二相似度值,并以最大化第一相似度值,最小化第二相似度值为训练目标,对语音转换模型进
语音降噪的模型训练方法、语音降噪方法、装置及介质.pdf
本申请公开了一种语音降噪的模型训练方法、语音降噪方法、装置及介质,属于语音编解码技术领域。该方法包括对预先获取的纯净语音与噪声进行声音混合,获取混合语音;对纯净语音与混合语音进行特征提取,获取理想子带增益与混合语音对应的倒谱系数;以及利用理想子带增益与倒谱系数对预设的神经网络进行训练,获取语音降噪模型。本申请提供一种语音降噪模型,通过将该语音降噪模型插入蓝牙编码器中,在编码过程中实现语音降噪的目的;在语音降噪的过程中,利用蓝牙编码器自身的时频转换模块获取谱系数,再进行后续的降噪步骤,使得本方案的降噪过程达