预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111611431A(43)申请公布日2020.09.01(21)申请号202010301644.X(22)申请日2020.04.16(71)申请人北京邮电大学地址100876北京市海淀区西土城路10号(72)发明人廖建新张磊陈爽王玉龙赵海秀王晶刘同存(51)Int.Cl.G06F16/65(2019.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书1页说明书3页附图1页(54)发明名称一种基于深度学习的音乐分类方法(57)摘要一种基于深度学习的音乐分类方法,包括:将音乐的音频文件转化成梅尔声谱图,并生成音乐标签的独热向量;将音乐的梅尔声谱图和音乐标签的独热向量分别传入卷积神经网络和循环神经网络,通过卷积神经网络获得音乐的频域和时域特征向量,通过循环神经网络获得音乐-标签关系向量,然后将卷积神经网络和循环神经网络各自的输出向量映射到相同维度后,连接合并构成一个音乐-标签嵌入向量;将音乐-标签嵌入向量传入标签预测层,其输出是音乐对应每个类别标签的概率值,最后根据概率值,从所有类别标签中挑选多个类别标签作为音乐的分类。本发明属于信息技术领域,能基于音乐类别的繁多和交错关系,实现音乐类别标签的准确预测。CN111611431ACN111611431A权利要求书1/1页1.一种基于深度学习的音乐分类方法,其特征在于,包括有:步骤一、将音乐的音频文件转化成梅尔声谱图,并生成音乐标签的独热向量BD:(bd1,bd2,…,bdn),其中,bd1、bd2、…、bdn分别表示音乐对应于各项类别标签的属性值,预先为音乐设置多个归属的类别标签,当音乐归属于第i项类别标签时,则bdi=1;当音乐不归属于第i项类别标签时,则bdi=0,i∈[1,n],n是类别标签的总数;步骤二、将音乐的梅尔声谱图和音乐标签的独热向量分别传入卷积神经网络和循环神经网络,通过卷积神经网络获得音乐的频域和时域特征向量,通过循环神经网络获得音乐-标签关系向量,然后将卷积神经网络和循环神经网络各自的输出向量映射到相同维度后,连接合并构成一个音乐-标签嵌入向量;步骤三、将音乐-标签嵌入向量传入标签预测层,其输出是音乐对应每个类别标签的概率值,最后根据概率值,从所有类别标签中挑选多个类别标签作为音乐的分类。2.根据权利要求1所述的方法,其特征在于,步骤二中,卷积神经网络由卷积层、残差连接层和池化层构成,第一层卷积层采用多个不同形状的滤波器堆叠而成,用于从输入的梅尔声谱图中提取音乐的频域和时域特征,然后将卷积层输出的频域和时域特征再依次经过残差连接层和池化层,从而最终输出音乐的频域和时域特征向量。3.根据权利要求2所述的方法,其特征在于,采用7*38、7*67形状的滤波器从输入的梅尔声谱图中提取音乐的频域特征,采用32*1、64*1、128*1形状的滤波器从输入的梅尔声谱图中提取音乐的时域特征。4.根据权利要求1所述的方法,其特征在于,步骤三中,标签预测层采用集束搜索算法来计算音乐对应每个类别标签的概率值,其预测路径是所有的类别标签,音乐对应每个类别标签的概率根据音乐-标签嵌入向量中的音乐的频域和时域特征和音乐-标签关系来计算。2CN111611431A说明书1/3页一种基于深度学习的音乐分类方法技术领域[0001]本发明涉及一种基于深度学习的音乐分类方法,属于信息技术领域。背景技术[0002]音乐是每天由数十亿人表演和聆听的最流行的艺术形式。音乐流派很多,如流行音乐、古典乐、爵士乐、民谣等。每个流派有不同的乐器,音色,节奏,节拍,流动等。音乐流派分类是音乐信息检索(MIR)的众多分支之一,利用它可以在音乐数据上进行其他任务,比如节拍追踪、音乐生成、推荐系统、音轨分离和乐器识别等等。[0003]传统的音乐分类方法,一首歌曲往往只属于某一类,类别种类单一且数量较少。但考虑到当今音乐类别的繁多与交错,同一歌曲可能会归属于多个类别,因此,如何实现音乐类别标签的准确预测,从而自动识别音乐的多个所属类别,已经成为技术人员普遍关注的技术问题。发明内容[0004]有鉴于此,本发明的目的是提供一种基于深度学习的音乐类别分类方法,能基于音乐类别的繁多和相互之间的交错关系,实现音乐类别标签的准确预测,从而自动识别音乐的多个所属类别。[0005]为了达到上述目的,本发明提供了一种基于深度学习的音乐分类方法,包括有:[0006]步骤一、将音乐的音频文件转化成梅尔声谱图,并生成音乐标签的独热向量BD:(bd1,bd2,…,bdn),其中,bd1、bd2、…、bdn分别表示音乐对应于各项类别标签的属性值,预先为音乐设置多个归属的类别标签,当音乐归属于第i项类别标签时,则bdi=1;当音乐不归属于第i