音频处理模型训练方法、装置、设备和介质.pdf
是你****韵呀
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频处理模型训练方法、装置、设备和介质.pdf
本发明实施例涉及一种音频处理模型训练方法、装置、设备和介质。该方法包括:获取初始音频数据;基于所述初始音频数据确定目标时域数据和目标频域数据;基于所述目标时域数据和所述目标频域数据,对预设模型进行训练,生成音频处理模型。通过上述技术方案,实现了同时利用音频数据的时域特征和频域特征对音频处理模型进行训练,提高了音频处理模型的精度。
音频处理方法和装置、模型训练方法和装置、设备及介质.pdf
本公开提供了一种音频处理方法和装置、模型的训练方法和装置、电子设备及介质,涉及人工智能领域,尤其涉及语音技术领域。实现方案为:依次针对从待处理音频数据中所提取的多个音频帧中的每一个音频帧,确定该音频帧的局部特征信息,其中,待处理音频数据包括来自至少两个声源的音频数据;以及将多个音频帧中的任意一个音频帧确定为目标音频帧,并针对目标音频帧执行以下操作:基于多个音频帧中的每一个音频帧的局部特征信息,确定目标音频帧的全局特征信息;以及基于目标音频帧的全局特征信息,确定目标音频帧所对应的声源分类。
音频处理方法和装置、音频模型训练方法和装置、电子设备及计算机可读存储介质.pdf
本申请公开了一种音频处理方法和装置、音频模型训练方法和装置、电子设备及计算机可读存储介质。该方法包括:获取待处理音频;提取所述待处理音频的特征向量;使用基于预定采样音频生成的混响训练音频训练获得的预定模型对所述特征向量进行计算以获得处理后音频。本申请实施例通过在模型训练中使用直达声和早期反射音频生成的音频作为训练的目标音频来对模型进行训练,并且在实际使用中使用经过这样训练的模型来对混合音频进行处理,因此,由于通过选用早期反射声,而不是直达声作为模型训练和恢复目标,可以有效地保护原始目标音频,保证处理后音频
音频处理模型的训练方法及装置、音频处理方法及装置.pdf
本公开关于一种音频处理模型的训练方法及装置、一种音频处理方法及装置。音频处理模型的训练方法包括:获取纯净音频信号的幅度谱和带噪音频信号的幅度谱;将带噪音频信号的幅度谱分成多个频段,得到带噪音频信号的多个频段的幅度谱;通过音频处理模型中的多个卷积神经网络预测与带噪音频信号的所述多个频段中的每个频段的幅度谱相应的降噪幅度谱,得到多个频段的降噪幅度谱;基于所述多个频段的降噪幅度谱获得降噪音频信号的幅度谱;通过将纯净音频信号的幅度谱与预测出的降噪音频信号的幅度谱进行比较来调整音频处理模型的参数,从而提高音频处理模
数据处理和模型训练方法、装置、设备及介质.pdf
本发明公开了数据处理和模型训练方法、装置、设备及介质,用以解决现有确定客流数据的过程计算量大、效率低、占用存储空间大的问题。本发明实施例中通过联合检测模型,便能够获取该待识别图像中每个包含有人头的目标检测框的位置信息、以及每个所述目标检测框中是否包含有人脸的信息,从而实现只需输入一次待识别图像到联合检测模型中,即可提取待识别图像中每个包含有人头的目标检测框的位置信息、以及每个所述目标检测框中是否包含有人脸的信息,减少了用于多次提取目标检测框在待识别图像中的区域的特征向量所需的计算量,并提高了客流数据的确定