预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110047514A(43)申请公布日2019.07.23(21)申请号201910461862.7(22)申请日2019.05.30(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人徐东(74)专利代理机构广州三环专利商标代理有限公司44202代理人郝传鑫熊永强(51)Int.Cl.G10L25/51(2013.01)G10L25/30(2013.01)G10L25/03(2013.01)G10H1/36(2006.01)权利要求书4页说明书14页附图4页(54)发明名称一种伴奏纯净度评估方法以及相关设备(57)摘要本发明实施例公开了一种伴奏纯净度评估方法以及相关设备,其中方法包括:获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;提取各个第一伴奏数据的音频特征;根据各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练,获得用于伴奏纯净度评估的神经网络模型;神经网络模型的模型参数是由各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签之间的关联关系确定的。通过实施本发明实施例,可实现高效准确地分辨消音伴奏和原版伴奏。CN110047514ACN110047514A权利要求书1/4页1.一种伴奏纯净度评估方法,其特征在于,包括:获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;所述各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;提取所述各个第一伴奏数据的音频特征;根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练,获得用于伴奏纯净度评估的神经网络模型;所述神经网络模型的模型参数是由所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签之间的关联关系确定的。2.根据权利要求1所述的方法,其特征在于,在提取所述各个第一伴奏数据的音频特征之前,所述方法还包括:对所述各个第一伴奏数据进行调整,以使所述各个第一伴奏数据的播放时长与预设播放时长相符;对所述各个第一伴奏数据进行归一化处理,以使所述各个第一伴奏数据的音强符合预设音强。3.根据权利要求1或2所述的方法,其特征在于,在根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练之前,所述方法还包括:根据Z-score算法对所述各个第一伴奏数据的音频特征进行处理,以使所述各个第一伴奏数据的音频特征标准化;其中所述各个第一伴奏数据的标准化后的音频特征符合正态分布。4.根据权利要求1-3任一项所述的方法,其特征在于,在获得用于伴奏纯净度评估的神经网络模型之后,所述方法还包括:获取多个第二伴奏数据的音频特征以及各个第二伴奏数据的对应的标签;将所述多个第二伴奏数据的音频特征输入到所述神经网路模型中,以获得各个第二伴奏数据的评估结果;根据所述各个第二伴奏数据的评估结果与所述各个第二伴奏数据的对应的标签的差距,获得所述神经网络模型的准确率;在所述神经网络模型的准确率低于预设阈值的情况下,调节模型参数重新对所述神经网络模型进行训练,直至所述神经网络模型的准确率大于等于预设阈值,且所述模型参数的变化幅度小于等于预设幅度。5.根据权利要求1-4任一项所述的方法,其特征在于,所述音频特征包括:梅尔频谱特征、相关谱感知线性预测特征、谱熵特征、感知线性预测特征中的任意一种或者任意多种组合。6.一种伴奏纯净度评估方法,其特征在于,包括:获取待检测数据,所述待检测数据包括伴奏数据;提取所述伴奏数据的音频特征;将所述音频特征输入到神经网络模型中,获得所述伴奏数据的纯净度评估结果;所述评估结果用于指示所述待检测数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据,所述神经网络模型是根据多个样本训练得到的,所述多个样本包括多个伴奏数据的音频特征以及各个伴奏数据对应的标签,所述神经网络模型的模型参数是由所述各个伴奏数据的音2CN110047514A权利要求书2/4页频特征以及各个伴奏数据对应的标签之间的关联关系确定的。7.根据权利要求6所述的方法,其特征在于,在提取所述伴奏数据的音频特征之前,所述方法还包括:对所述伴奏数据进行调整,以使所述伴奏数据的播放时长与预设播放时长相符;对所述伴奏数据进行归一化处理,以使所述伴奏数据的音强符合预设音强。8.根据权利要求6或7所述的方法,其特征在于,在将所述音频特征输入到神经网络模型中之前,所述方法还包括:根据Z-score算法对所述伴奏数据的音频特征进行处理,以使所述伴奏数据的音频特征标准化;其中所述伴奏数据标准化