检测模型训练方法、语音对话检测方法及相关设备.pdf
梦影****主a
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
检测模型训练方法、语音对话检测方法及相关设备.pdf
本发明提供一种检测模型训练方法、语音对话检测方法及相关设备,该方法包括:构建待训练对话文本检测模型,所述待训练对话文本检测模型包括输入网络层、共享网络层和N个独占网络层,每一所述独占网络层与一个检测任务对应,N为正整数;利用目标文本以及N个检测任务对应的字段信息对所述待训练对话文本检测模型进行训练得到所述对话文本检测模型,所述N个检测任务各不相同。本发明实施例降低了语音检测的成本。
语音内容检测方法、模型训练方法及相关装置.pdf
本申请提出一种语音内容检测方法、模型训练方法、装置、电子设备及存储介质,该方法包括:将目标语音的音频数据以及所述目标语音对应的视频数据,输入预先训练的多模态音频帧分类网络,得到对所述目标语音的各个音频帧的分类结果;其中,所述目标语音对应的视频数据中包含所述目标语音的说话人的面部影像;所述多模态音频帧分类网络,是与辅助训练网络联合训练得到的、用于将音频帧分类为语音帧或非语音帧的神经网络;在所述联合训练过程中,所述辅助训练网络以语音训练样本的文本标签为训练标签,对语音训练样本进行语音内容识别训练。上述方法能够
语音顺滑模型训练方法、语音顺滑方法及相关设备.pdf
本申请公开了一种语音顺滑模型的训练方法、语音顺滑方法及相关设备,该方法通过语音顺滑模型中的编码网络和第一解码网络对样本语音数据进行语音识别预测,得到预测文本识别结果;获取编码网络输出的第一隐特征以及第一解码网络输出的第二隐特征,通过语音顺滑模型中的第二解码网络对该第一隐特征和第二隐特征进行语音顺滑预测,得到预测顺滑结果。基于各个预测结果所构建的总损失函数来训练语音顺滑模型,获得经训练的语音顺滑模型。从而在利用了原始语音信息的同时,也完整的保留了说话人的发音习惯等个人信息,减少了语音识别的误判,提高语音顺滑
语音增强模型训练方法、语音增强方法、相关设备及介质.pdf
本公开关于一种语音增强模型训练方法、语音增强方法、相关设备及介质。训练方法包括:基于三维声场麦克风采集的三维扫频信号,确定三维房间冲激响应;将单通道纯净时域语音信号和时域噪声信号分别与三维房间冲激响应进行卷积,得到纯净时域三维语音信号和时域三维噪声信号;基于预设信噪比对纯净时域三维语音信号和时域三维噪声信号进行混合处理,得到样本含噪时域三维语音信号;将样本含噪时域三维语音信号的复数谱输入到语音增强模型中,得到单通道预估增强复数谱;基于单通道预估增强复数谱对应的预估时域信号和单通道纯净时域语音信号,确定语音
语音增强方法、模型训练方法以及相关设备.pdf
本公开提供一种语音增强方法、模型训练方法以及相关设备。语音增强模型包括语音预测神经网络模块、噪声估计神经网络模块以及线性滤波模块,模型训练方法包括:获取训练集中各语音对的带噪语音幅度谱以及纯净语音幅度谱;根据带噪语音幅度谱获得第一特征集以及第二特征集;将第一特征集输入语音预测神经网络模块,以输出第一准估计纯净语音幅度谱以及预测误差;将第二特征集输入噪声估计神经网络模块,以输出估计噪声能量;将第一准估计纯净语音幅度谱、预测误差、估计噪声能量输入线性滤波模块,线性滤波模块用于输出估计纯净语音幅度谱;根据纯净语