预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106649513A(43)申请公布日2017.05.10(21)申请号201610899028.2(22)申请日2016.10.14(71)申请人盐城工学院地址224051江苏省盐城市世纪大道1166号(72)发明人徐森徐秀芳花小朋徐静徐宁皋军安晶曹瑞(74)专利代理机构苏州创元专利商标事务所有限公司32103代理人范晴丁浩秋(51)Int.Cl.G06F17/30(2006.01)G06K9/62(2006.01)权利要求书1页说明书4页附图3页(54)发明名称基于谱聚类的音频数据聚类方法(57)摘要本发明公开了一种基于谱聚类的音频数据聚类方法,包括以下步骤:计算音频数据的音频周期,按照音频周期进行分帧处理,提取音频特征;以帧频谱图峰值最大处的频率序列方差为横轴、以每帧功率和的序列方差的对数值为纵轴、以功率和的平均值为Z轴,构建音频三维坐标系,得到三维音频向量,然后根据音频向量间的距离计算相似度,得到音频数据的相似度矩阵S;利用谱聚类方法对音频数据进行聚类。本发明可为海量的音乐自动分类提供实用方法,并且能精准的推荐给不同的用户增强用户体验。CN106649513ACN106649513A权利要求书1/1页1.一种基于谱聚类的音频数据聚类方法,其特征在于,包括以下步骤:S01:计算音频数据的音频周期,按照音频周期进行分帧处理,提取音频特征;S02:以帧频谱图峰值最大处的频率序列方差为横轴、以每帧功率和的序列方差的对数值为纵轴、以功率和的平均值为Z轴,构建音频三维坐标系,得到三维音频向量,然后根据音频向量间的距离计算相似度,得到音频数据的相似度矩阵S;S03:利用谱聚类方法对音频数据进行聚类。2.根据权利要求1所述的基于谱聚类的音频数据聚类方法,其特征在于,所述步骤S01提取音频特征之前还包括:对每帧音频数据进行傅立叶变换,取幅值最高的频率保存在一个频率序列中,然后对该频率序列进行自相关运算。3.根据权利要求1所述的基于谱聚类的音频数据聚类方法,其特征在于,所述步骤S03包括以下步骤:-1S11:首先构建拉普拉斯矩阵Lrw=I-DS,其中I为单位矩阵,D为对角度矩阵,S为相似度矩阵;S12:求解Lrw的前k个最小特征值对应的特征向量u1…uk,并构建矩阵Uk=[u1…uk];S13:使用K均值算法对Uk的行聚类,得到k个簇。2CN106649513A说明书1/4页基于谱聚类的音频数据聚类方法技术领域[0001]本发明涉及一种音频数据聚类方法,具体地涉及一种基于谱聚类的音频数据聚类方法。背景技术[0002]近二十年,因互联网惊人的发展速度,海量信息不断涌现。如何从海量信息中找到有用的信息,已经成为各大网络数据公司面临的主要问题。传统的统计和计算已经不能满足于公众和各大公司的需求,源自数据挖掘、机器学习等领域的方法迅速发展。通过设置一定的规则和条件,能够快速有效地找出海量数据中的有用信息。[0003]网易云音乐已经收录了3500万的不同歌曲和音乐,同时,在美国,每周会有大约50张专辑发布,平均每张专辑会有12首左右的音乐。如何快速对这些数量众多的音乐和歌曲进行分类成为了难题。而且音乐的分类方法又各有各的不同,可以按照音乐的情感分类,也可以按照演奏方式分类,有时,摇滚音乐下面就可以被细分为上百种类型,电子音乐甚至可以被细分为超过500种类型。而早期的音乐分类方式往往是唱片公司人为的添加类型标签供买家选择,而有时又是由专门收录音乐的网站添加标签,不同的人对同一首音乐的感受往往各不相同,因此也极有可能添加了不同的标签。因此,由计算机对音频数据识别后进行分类得到的结果更方便我们对音乐不同类型的区别进行研究,也可以方便我们直接将同类型的音乐推荐给用户。[0004]聚类分析将数据元素在无监督的环境下进行自动划分并从中找出隐含规律的科学研究方法。聚类过程即根据不同的特征以及不同的统计量将数据分别划分到不同的簇的过程。通常情况下,在每个独立的类中,数据元素应有较大的相似性,而不同的簇间的元素则应有比较大的差异性。在统计学上,可以通过数学建模去简化数据进行聚类分析找到隐藏的信息,在机器学习中,通过对簇的分析可以找到簇间和簇内的隐藏模式。无监督的学习并不依赖于预先带有标记的任何数据集,只需要通过聚类学习算法来自动的确定数据集的标记和类型。发明内容[0005]针对上述技术问题,本发明目的是:提供一种基于谱聚类的音频数据聚类方法,与其他音频数据聚类方法不同,本发明以帧频谱图峰值最大处的频率序列方差为横轴、以每帧功率和的序列方差的对数值为纵轴、以功率和的平均值为Z轴,构建音频三维坐标系,得到三维音频向量,根据音频向量间的距离计算音频数据相似度,利用谱聚类方法对音频数据进行聚类。从