预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110739006A(43)申请公布日2020.01.31(21)申请号201910985330.3(22)申请日2019.10.16(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人徐东(74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙)44300代理人彭绪坤(51)Int.Cl.G10L25/03(2013.01)G10L25/27(2013.01)G10L25/60(2013.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书16页附图7页(54)发明名称音频处理方法、装置、存储介质及电子设备(57)摘要本申请公开了一种音频处理方法、装置、存储介质及电子设备。该音频处理方法包括:获取伴奏音频;提取该伴奏音频的音频特征,该音频特征包括谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA-PLP特征、PLP特征以及频谱滚降特征中的至少一种;将该音频特征输入至预设模型,并获取该预设模型的输出结果,该预设模型为经过机器学习的模型;根据该输出结果,确定该伴奏音频的品质等级。本申请可以有效地确定伴奏的品质。CN110739006ACN110739006A权利要求书1/2页1.一种音频处理方法,其特征在于,包括:获取伴奏音频;提取所述伴奏音频的音频特征,所述音频特征包括谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA-PLP特征、PLP特征以及频谱滚降特征中的至少一种;将所述音频特征输入至预设模型,并获取所述预设模型的输出结果,所述预设模型为经过机器学习的模型;根据所述输出结果,确定所述伴奏音频的品质等级。2.根据权利要求1所述的音频处理方法,其特征在于,所述方法还包括:获取多个训练样本,各所述训练样本包括伴奏样本对应的音频特征以及标签信息,所述标签信息用于表示伴奏样本的品质等级;获取模型M0,并利用所述训练样本对所述模型M0进行学习训练,得到模型M1,其中,所述模型M1满足预设第一条件,所述预设第一条件为模型的损失函数的值小于预设第一阈值且模型的判断准确率达到预设第二阈值;获取由所述模型M0训练得到所述模型M1的过程中学习到的第一训练参数;获取多个验证样本,并利用模型Mi对所述验证样本进行判断,并在判断错误时将对应的验证样本确定为复核样本,其中,i为大于或等于1的整数,每经过一轮验证i的数值递增1;更改目标样本的标签信息,并记录所述目标样本,所述目标样本为标签信息有误的复核样本;基于更改标签信息后的目标样本选取新的训练样本;利用所述第一训练参数以及新的训练样本,对所述模型M0进行学习训练,得到模型Mj,其中,所述模型Mj满足所述预设第一条件,所述j为大于或等于2的整数,每经过一轮学习j的数值递增1;在得到模型Mj后,触发执行所述获取多个验证样本及其后的步骤,直至最近得到的预设数量的模型之间的判断准确率的差距小于预设第三阈值,并将最新得到的模型确定为第一目标模型;利用所述第一目标模型对记录的目标样本进行再次判断,并将再次判断错误的目标样本删除;在删除再次判断错误的目标样本后,选取新的目标训练样本,并利用所述第一训练参数以及新的目标训练样本,对所述模型M0进行学习训练,得到第二目标模型;将所述第二目标模型确定为预设模型。3.根据权利要求2所述的音频处理方法,其特征在于,所述获取多个训练样本,包括:获取多个样本音频,所述样本音频为消音后的歌曲伴奏;对每一样本音频,截取第一播放时间点至第二播放时间点之间的音频部分,并将其确定为伴奏样本;根据所述伴奏样本获取训练样本,得到多个训练样本。4.根据权利要求3所述的音频处理方法,其特征在于,所述对每一样本音频,截取第一播放时间点至第二播放时间点之间的音频部分,并将其确定为伴奏样本,包括:对每一样本音频,截取第一播放时间点至第二播放时间点之间的音频部分,并将其确2CN110739006A权利要求书2/2页定为伴奏样本,其中,对于播放时长达不到所述第二播放时间点的样本音频进行数据补零处理,以使伴奏样本的时间长度达到预设时长,所述预设时长为所述第一播放时间点与所述第二播放时间点相差的时长。5.根据权利要求4所述的音频处理方法,其特征在于,所述根据伴奏样本获取训练样本,包括:提取所述伴奏样本的音频特征,所述音频特征包括谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA-PLP特征、PLP特征以及频谱滚降特征中的至少一种;获取所述伴奏样本的标签信息;将所述伴奏样本的音频特征和标签信息封装,得到对应的训练样本。6.根据权利要求5所述的音频处