预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106847248A(43)申请公布日2017.06.13(21)申请号201710007672.9(22)申请日2017.01.05(71)申请人天津大学地址300072天津市南开区卫津路92号(72)发明人李锵王蒙蒙关欣(74)专利代理机构天津市北洋有限责任专利代理事务所12201代理人刘国威(51)Int.Cl.G10H1/38(2006.01)G10L15/08(2006.01)G10L15/10(2006.01)G10L25/27(2013.01)G10L25/54(2013.01)权利要求书1页说明书7页附图1页(54)发明名称基于鲁棒性音阶轮廓特征和向量机的和弦识别方法(57)摘要本发明涉及和弦自动识别,为提取鲁棒性音阶轮廓和弦特征,并能够快速准确的对和弦进行识别。本发明,基于鲁棒性音阶轮廓特征和向量机的和弦识别方法,包括下列步骤:1)对原始音频信号进行加窗预处理;2)对分帧结果进行离散余弦变换,得到原始信号的标准音频频谱矩阵S;3)通过凸优化问题进行全局最优解的求解:4)为了得到鲁棒性PCP特征,进行矩阵映射;5)采用测度学习的方法对支持向量机的高斯核函数进行优化;6)利用训练数据对测度学习支持向量机进行训练,确定测度学习支持向量机中的参数;7)使用训练好的测度学习支持向量机对测试数据进行识别,得到最终的识别率。本发明主要应用于和弦自动识别场合。CN106847248ACN106847248A权利要求书1/1页1.一种基于鲁棒性音阶轮廓特征和向量机的和弦识别方法,其特征是,包括下列步骤:1)对原始音频信号进行加窗预处理,得到音乐信号的分帧结果;2)对分帧结果进行离散余弦变换,得到原始信号的标准音频频谱矩阵S;3)假设频谱中谐波成分矩阵A和非谐波成分矩阵E是相互独立的,那么就有:S=A+E;矩阵通过以下凸优化问题进行全局最优解的求解:其中||·||*表示矩阵的核范数,即矩阵的奇异值之和;||·||1表示矩阵的一范数,即所有非零元素之和;该优化问题通过增广拉格朗日乘子法进行解决;4)为了得到鲁棒性PCP特征,将矩阵A乘映射矩阵P:P表示频谱矩阵和由RPCP向量组成的色度矩阵chromagram之间的变换矩阵,其中fi表示音乐中12平均律所定义出来的12个音阶的基频,1≤i≤12,2π·ωj则表示时频变换后所得到的各个频率成分的频率值,0≤j≤N-1,另外,b通常情况下,规定音符A4处的频率440Hz为基准频率,并通过fA4·2获得其他音符处的频率值,其中b为音符与A4之间的音程差,然后,通过映射公式(3)来对谐波矩阵A的各个频率成分进行映射,从而获得鲁棒音阶轮廓特征向量,其中2πω对应矩阵A每一行所对应的频b率值,而fi则表示音乐中通用的中央八度内12个音符所对应的频率,通过fA4·2获得;5)采用测度学习的方法对支持向量机的高斯核函数进行优化:根据和弦特征的特点,从问题本身的先验知识中有监督的学习到一个距离方程,该距离方程的求解是凸优化问题,从而使用梯度下降算法求得全局最优解,进而用求得的转换矩阵最优解对支持向量机的核函数进行优化,得到基于测度学习的高斯核函数;6)利用训练数据对测度学习支持向量机进行训练,确定测度学习支持向量机中的参数;7)使用训练好的测度学习支持向量机对测试数据进行识别,得到最终的识别率。2CN106847248A说明书1/7页基于鲁棒性音阶轮廓特征和向量机的和弦识别方法技术领域[0001]本发明涉及和弦自动识别,具体讲,涉及基于鲁棒性音阶轮廓特征(RobustPitchClassProfiles,RPCP)和测度学习支持向量机(metriclearningSupportVectorMachine,mlSVM)和弦识别方法。背景技术[0002]和弦识别是音乐信号处理的重要研究问题之一,它在歌曲翻唱识别,音频匹配以及音乐推荐系统等领域都有重要作用。和弦作为乐曲得重要组成部分,它由三个以上的音按照三度关系叠加起来构成,充分表现了一段乐曲内容和特征,对于音乐的认知具有重要作用。因此,和弦在频域的结构特征和和弦识别是计算机音乐信号处理的一个关键问题。[0003]一般认为,和弦识别是音乐信息检索的中心任务之一,它对音乐信息检索技术的发展具有重要作用。在和弦识别的研究中,主要包括两个方面的研究内容一个是和弦特征的提取,另一个就是模式识别方法的选择。在音乐和弦识别的信号分析中,广泛采用了一种叫做音级轮廓特征(PitchClassProfiles,PCP)的信号特征。该特征将信号能量压缩到了音乐的12个音级上,从而形成12维的特征向量。结合谐波信息,谐波音阶轮廓特征被用于和弦识别系统中,谐波音阶轮廓特征能够有效减弱乐器的类别对和弦的