音频处理方法、装置及存储介质.pdf
慧娇****文章
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频处理方法、装置及存储介质.pdf
本发明实施例公开了一种音频处理方法、装置及存储介质。该方案可以获取目标歌曲的音频数据,并提取所述音频数据中的预设数据片段,以预设帧长将所述预设数据片段划分为多个数据帧,将所述多个数据帧中相匹配的数据帧归类至同一数据帧集合,以得到多个目标数据帧集合,根据所述多个目标数据帧集合,将所述预设数据片段划分为多个子片段。本申请实施例所提供的方案可以将歌曲中数据片段划分为多个数据帧,并归类为多个数据帧集合,然后将数据片段划分为多个子片段,从而划分出歌曲片段中反复咏唱的部分,进一步提升音乐分段的精确性。
音频处理方法、装置及存储介质.pdf
本发明实施例公开了一种音频处理方法、装置及存储介质。该方案通过获取具有目标音频标识的独唱音频和用户输入的合唱音频,获取独唱音频当中的第一伴奏音频响度与第一人声音频响度,根据第一伴奏音频响度对合唱音频的第二伴奏音频响度进行调整,并将调整后的第二伴奏音频替换至独唱音频中,得到半合唱音频,根据第一人声音频响度对合唱音频的第二人声音频响度进行调整,并将调整后的第二人声音频与半合唱音频进行合成。本申请实施例所提供的方案通过计算独唱音频当中的第一伴奏音频与第一人声音频响度,并以此调节合唱音频中的人声及伴奏,使得在将独
音频处理方法、装置及存储介质.pdf
本发明实施例公开了一种音频处理方法、装置及存储介质。该方案可以获取待处理音频信号,待处理音频信号包括截幅失真部分,获取预先训练完成的目标序列生成模型,其中目标序列生成模型为对失真音频信号样本训练得到的神经网络模型,且目标序列生成模型包括非因果膨胀卷积层,将待处理音频信号输入至目标序列生成模型,以使非因果膨胀卷积层依据截幅失真部分前后的音频信号对截幅失真部分进行修复,得到修复后的音频信号。本申请实施例所提供的方案可以针对待修复的截幅失真的音频,通过预测模型进行音频信号修复,从而提升音频音质。
音频处理方法、装置及存储介质.pdf
本申请公开了一种音频处理方法、装置及存储介质,所述方法包括:获取训练样本,其中,所述训练样本包含有与多个歌手对应的多个演唱片段组,每一演唱片段组分别对应同一歌手的多个演唱片段,并对所述训练样本进行特征提取,以提取出所述训练样本的音频特征,然后将所述训练样本的音频特征输入参考模型中进行学习训练,以生成处理模型,并基于所述处理模型对待测音频进行音频处理,以获取所述待测音频的音色特征,可以在不要求干声的情况下,有效识别出音色特征,提升了音色特征识别的高效性、鲁棒性及准确性。
音频处理方法、装置及存储介质.pdf
本发明实施例公开了一种音频处理方法、装置及存储介质。该方案可以确定目标歌曲,获取目标歌曲的音频数据,对音频数据进行拆分,以得到音频数据中的多个单声道音频数据,确定单声道音频数据的目标特征的特征变化值,其中目标特征为能够表示音频数据韵律情况的特征,根据特征变化值,计算单声道音频数据的韵律均值,根据多个单声道音频数据的韵律均值,计算目标歌曲的韵律均值。本申请实施例所提供的方案可以根据音频数据中的多个单声道音频数据分别对应的韵律均值计算目标歌曲的韵律均值,从而实现对歌曲的韵律感进行预测,确定歌曲的韵律强弱信息。