一种音频文件的分类方法及装置-豆柴文库

一种音频文件的分类方法及装置.pdf

2023-12-07

10金币

551KB

7页

Do****76

实名认证

内容提供者

1/7

2/7

3/7

4/7

5/7

6/7

7/7

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105895110A(43)申请公布日2016.08.24(21)申请号201610512234.3(22)申请日2016.06.30(71)申请人北京奇艺世纪科技有限公司地址100080北京市海淀区北一街2号鸿城拓展大厦10、11层(72)发明人黄瑛兰细鹏胡明清王涛(74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙)11413代理人项京马敬(51)Int.Cl.G10L19/02(2013.01)G06F17/30(2006.01)权利要求书1页说明书4页附图1页(54)发明名称一种音频文件的分类方法及装置(57)摘要本发明实施例公开了一种音频文件的分类方法及装置，预先将音乐进行分类，并获得每一类音乐的语谱图；方法包括：针对待分类的目标音频文件，获得所述目标音频文件的语谱图；根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定所述目标音频文件的类别。利用本发明实施例，实现了通过语谱图对音频文件进行分类。CN105895110ACN105895110A权利要求书1/1页1.一种音频文件的分类方法，其特征在于，预先将音乐进行分类，并获得每一类音乐的语谱图；所述方法包括：针对待分类的目标音频文件，获得所述目标音频文件的语谱图；根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定所述目标音频文件的类别。2.根据权利要求1所述的方法，所述针对待分类的目标音频文件，获得所述目标音频文件的语谱图，包括：针对待分类的目标音频文件，将所述目标音频文件进行分段；分别获得每一段音频文件的语谱图。3.根据权利要求2所述的方法，所述根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定所述目标音频文件的类别，包括：利用神经网络，根据所述每一段音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定每一段音频文件的类别；根据所有段音频文件的类别，确定所述目标音频文件的类别。4.根据权利要求2所述的方法，所述分别获得每一段音频文件的语谱图，包括：分别针对每一段音频文件，针对所述段音频文件的每一音频帧进行傅里叶变换，得到所述音频帧的频谱值；根据所述段音频文件的每一音频帧的频谱值，生成所述段音频文件的语谱图。5.根据权利要求3所述的方法，所述神经网络为：卷积神经网络。6.一种音频文件的分类装置，其特征在于，预先将音乐进行分类，并获得每一类音乐的语谱图；所述装置包括：获得模块，用于针对待分类的目标音频文件，获得所述目标音频文件的语谱图；确定模块，用于根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定所述目标音频文件的类别。7.根据权利要求6所述的装置，所述获得模块，包括：分段子模块，用于针对待分类的目标音频文件，将所述目标音频文件进行分段；获得子模块，用于分别获得每一段音频文件的语谱图。8.根据权利要求7所述的装置，所述确定模块，具体用于：利用神经网络，根据所述每一段音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定每一段音频文件的类别；根据所有段音频文件的类别，确定所述目标音频文件的类别。9.根据权利要求7所述的装置，所述获得子模块，具体用于：分别针对每一段音频文件，针对所述段音频文件的每一音频帧进行傅里叶变换，得到所述音频帧的频谱值；根据所述段音频文件的每一音频帧的频谱值，生成所述段音频文件的语谱图。10.根据权利要求8所述的装置，所述神经网络为：卷积神经网络。2CN105895110A说明书1/4页一种音频文件的分类方法及装置技术领域[0001]本发明涉及音频技术领域，特别涉及一种音频文件的分类方法及装置。背景技术[0002]互联网多媒体时代，人们对音乐的需求变得越来越多样化。音乐分类，有助于人们对音乐进行标注，例如对不同的音乐流派标注不同的情感，也可以方便用户更好地按照兴趣获取音乐资源。[0003]传统的音乐分类方法，通过对音频提取特征，然后用分类器来进行分类。音频特征包括：时域特征，包含短时平均能量、线性预测系数、过零率以及衍生特征；频域特征，包含Mel系数、LPC倒频谱系数以及熵特征；时频特征，包含小波系数。在这个过程中，有效的音频特征提取与选择是一个较为复杂的过程。发明内容[0004]本发明实施例的目的在于提供一种音频文件的分类方法及装置，以实现通过语谱图对音频文件进行分类。[0005]为达到上述目的，本发明实施例公开了一种音频文件的分类方法，预先将音乐进行分类，并获得每一类音乐的语谱图；方法包括：[0006]针对待分类的目标音频文件，获得所述目标音频文件的语谱图；[0007]根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定所述目标音频文件的类别。[0008]较佳的，所述针

相关资料

一种音频文件的分类方法及装置.pdf

本发明实施例公开了一种音频文件的分类方法及装置，预先将音乐进行分类，并获得每一类音乐的语谱图；方法包括：针对待分类的目标音频文件，获得所述目标音频文件的语谱图；根据所述目标音频文件的语谱图以及所述每一类音乐的语谱图的相似性，确定所述目标音频文件的类别。利用本发明实施例，实现了通过语谱图对音频文件进行分类。

2023-12-07

551KB

一种音频文件的播放方法及装置.pdf

本发明公开了一种音频文件的播放方法及装置，该音频文件的播放方法包括：获取待播放的音频文件，并提取该音频文件的特征信息集合；通过预置算法从该特征信息集合中选择对应的特征信息作为目标特征信息；根据该目标特征信息确定该音频文件的背景图像，该背景图像为动态图像；在播放该音频文件的过程中，根据该目标特征信息控制该背景图像在背景窗口中的动态显示。上述音频文件的播放方法能根据不同的歌曲选择不同的动态图像作为动态的显示背景，不仅实现简单，而且可以使得背景的切换更加灵活，以及显示场景更加丰富，大大改善了显示效果。

2023-12-06

749KB

一种音频文件播放方法及装置.pdf

本发明实施例公开了一种音频文件播放方法及装置。本发明实施例通过解析音频文件的音频信号的响度，根据所述音频信号的响度，确定响度高于预设阈值的播放时间段，播放响度高于预设阈值的播放时间段对应的音频文件，即不会对音频文件的空白区域进行播放，可以提高音频文件的播放效率。

2023-06-14

1.2MB

一种音频文件推荐方法及装置.pdf

本申请涉及数据业务技术领域，尤其涉及一种音频文件推荐方法及装置，用以解决现有技术中存在的推荐音乐的准确率较低的问题。本申请实施例提供的音频文件推荐方法包括：针对待分析音频文件集合中的每一类音频文件，确定该类音频文件的权重值，其中，所述权重值用于表征用户对该类音频文件的喜好程度；根据接收到的对于所述待分析音频文件集合中的当前播放的音频文件的操作请求，调整各类音频文件的权重值；并，基于调整后的各类音频文件的权重值，从所述待分析音频文件集合中选取音频文件推荐给用户。

2023-12-05

401KB

一种音频文件共享方法、装置及音箱.pdf

本发明适用于移动终端技术领域，提供了一种音频文件共享方法、装置及音箱，包括：接收音频信息，所述音频信息包括音频文件标识和音频文件；根据接收到的所述音频文件标识生成播放列表；根据音频文件标识的重复频率确定播放列表中各音频文件的播放顺序；根据所述播放顺序播放所述音频文件标识对应的音频文件。在本发明实施例中，根据音频文件标识的重复频率确定播放列表中各音频文件的播放顺序；根据所述播放顺序播放所述音频文件标识对应的音频文件，以确定参加聚会的大部份人员喜欢的音乐，无需接收用户重新添加的音乐，避免了重新添加音乐的情况，

2023-12-07

3.9MB