预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105895110A(43)申请公布日2016.08.24(21)申请号201610512234.3(22)申请日2016.06.30(71)申请人北京奇艺世纪科技有限公司地址100080北京市海淀区北一街2号鸿城拓展大厦10、11层(72)发明人黄瑛兰细鹏胡明清王涛(74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙)11413代理人项京马敬(51)Int.Cl.G10L19/02(2013.01)G06F17/30(2006.01)权利要求书1页说明书4页附图1页(54)发明名称一种音频文件的分类方法及装置(57)摘要本发明实施例公开了一种音频文件的分类方法及装置,预先将音乐进行分类,并获得每一类音乐的语谱图;方法包括:针对待分类的目标音频文件,获得所述目标音频文件的语谱图;根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性,确定所述目标音频文件的类别。利用本发明实施例,实现了通过语谱图对音频文件进行分类。CN105895110ACN105895110A权利要求书1/1页1.一种音频文件的分类方法,其特征在于,预先将音乐进行分类,并获得每一类音乐的语谱图;所述方法包括:针对待分类的目标音频文件,获得所述目标音频文件的语谱图;根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性,确定所述目标音频文件的类别。2.根据权利要求1所述的方法,所述针对待分类的目标音频文件,获得所述目标音频文件的语谱图,包括:针对待分类的目标音频文件,将所述目标音频文件进行分段;分别获得每一段音频文件的语谱图。3.根据权利要求2所述的方法,所述根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性,确定所述目标音频文件的类别,包括:利用神经网络,根据所述每一段音频文件的语谱图以及所述每一类音乐的语谱图的相似性,确定每一段音频文件的类别;根据所有段音频文件的类别,确定所述目标音频文件的类别。4.根据权利要求2所述的方法,所述分别获得每一段音频文件的语谱图,包括:分别针对每一段音频文件,针对所述段音频文件的每一音频帧进行傅里叶变换,得到所述音频帧的频谱值;根据所述段音频文件的每一音频帧的频谱值,生成所述段音频文件的语谱图。5.根据权利要求3所述的方法,所述神经网络为:卷积神经网络。6.一种音频文件的分类装置,其特征在于,预先将音乐进行分类,并获得每一类音乐的语谱图;所述装置包括:获得模块,用于针对待分类的目标音频文件,获得所述目标音频文件的语谱图;确定模块,用于根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性,确定所述目标音频文件的类别。7.根据权利要求6所述的装置,所述获得模块,包括:分段子模块,用于针对待分类的目标音频文件,将所述目标音频文件进行分段;获得子模块,用于分别获得每一段音频文件的语谱图。8.根据权利要求7所述的装置,所述确定模块,具体用于:利用神经网络,根据所述每一段音频文件的语谱图以及所述每一类音乐的语谱图的相似性,确定每一段音频文件的类别;根据所有段音频文件的类别,确定所述目标音频文件的类别。9.根据权利要求7所述的装置,所述获得子模块,具体用于:分别针对每一段音频文件,针对所述段音频文件的每一音频帧进行傅里叶变换,得到所述音频帧的频谱值;根据所述段音频文件的每一音频帧的频谱值,生成所述段音频文件的语谱图。10.根据权利要求8所述的装置,所述神经网络为:卷积神经网络。2CN105895110A说明书1/4页一种音频文件的分类方法及装置技术领域[0001]本发明涉及音频技术领域,特别涉及一种音频文件的分类方法及装置。背景技术[0002]互联网多媒体时代,人们对音乐的需求变得越来越多样化。音乐分类,有助于人们对音乐进行标注,例如对不同的音乐流派标注不同的情感,也可以方便用户更好地按照兴趣获取音乐资源。[0003]传统的音乐分类方法,通过对音频提取特征,然后用分类器来进行分类。音频特征包括:时域特征,包含短时平均能量、线性预测系数、过零率以及衍生特征;频域特征,包含Mel系数、LPC倒频谱系数以及熵特征;时频特征,包含小波系数。在这个过程中,有效的音频特征提取与选择是一个较为复杂的过程。发明内容[0004]本发明实施例的目的在于提供一种音频文件的分类方法及装置,以实现通过语谱图对音频文件进行分类。[0005]为达到上述目的,本发明实施例公开了一种音频文件的分类方法,预先将音乐进行分类,并获得每一类音乐的语谱图;方法包括:[0006]针对待分类的目标音频文件,获得所述目标音频文件的语谱图;[0007]根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性,确定所述目标音频文件的类别。[0008]较佳的,所述针