预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106782583A(43)申请公布日2017.05.31(21)申请号201611132721.3(22)申请日2016.12.09(71)申请人天津大学地址300072天津市南开区卫津路92号(72)发明人李锵王蒙蒙关欣(74)专利代理机构天津市北洋有限责任专利代理事务所12201代理人李素兰(51)Int.Cl.G10L21/013(2013.01)G10L21/0224(2013.01)G10L21/0232(2013.01)G10L25/18(2013.01)G10L25/45(2013.01)权利要求书2页说明书4页附图3页(54)发明名称基于核范数的鲁棒音阶轮廓特征提取算法(57)摘要本发明公开了一种专基于核范数的鲁棒音阶轮廓特征提取算法,步骤1、待输入音乐信号转换;步骤2、对音乐信号进行加窗处理,并进行傅立叶变换,得到音乐信号的时频矩阵,确定起始节拍点;步骤3、利用核范数约束对时频矩阵的秩进行频谱低秩化;同时用一范数约束矩阵中的噪声点,用以下凸优化问题对信号频谱进行低秩化,并去除噪声;步骤4、在迭代约束过程中,利用频谱的低秩特性,实现阈值自适应调整算法;步骤5、对时频矩阵进行有效的降维处理,得到12维的和弦特征。与现有技术相比,本发明提取出了鲁棒性的和弦特征;有效地降低了算法的时间;能准确地恢复不同类型和风格的音乐信号的音阶轮廓特征。CN106782583ACN106782583A权利要求书1/2页1.一种专基于核范数的鲁棒音阶轮廓特征提取算法,其特征在于,该算法包括以下步骤:步骤(1)、将待输入音乐信号转换为采样率22050Hz/16bit/单通道的标准音频,作为被参考的音频信号x(n),其中n为转换后音频信号所包含的数据点数;步骤(2)、对音乐信号x(n)进行加窗处理,窗函数为W(k),其中k为窗函数的窗口宽度,从而得到信号时域矩阵Xk×m,其中X·,m=x(km/2:km/2+m)W(k),m为分帧之后得到的帧数,然后进行傅立叶变换(FourierTransform),得到音乐信号的时频矩阵D=FX,其中F为傅里叶变换矩阵;步骤(3)、假设音频信号频谱所包含的谐波成分与噪声是相互独立的,即D=A+E,其中矩阵A表示频谱矩阵中所包含的谐波成分做构成的矩阵,而E表示频谱矩阵中所包含的噪声成分所构成的矩阵;根据以上假设,谐波矩阵A的恢复可以归结为以下凸优化问题:s.t.A+E=D其中||||*表示矩阵的核范数(nuclearnorm),即矩阵的奇异值之和;||||1表示矩阵的一范数,即所有非零元素之和;分离出来的矩阵A就是低秩化之后的频谱,而矩阵E则包含稀疏大噪声以及其他非谐波成分,D则是原始的音乐信号的频谱;步骤(4)、在迭代约束过程中,利用频谱的低秩特性,实现阈值自适应调整算法;具体步骤如下:初始化奇异值截断阈值参数μ,参数λ,迭代索引k=0,临时矩阵Y0=D,E0为全零矩阵;进行奇异值分解得到奇异值矩阵Σ;接着,从μk到1.5μk等间隔选取二十个数据点其中1≤i≤20,对于每个进行奇异值分解逆操作由于谐波成分只分布在数个频率点上,因此计算矩阵中某一列的方差,并从中选取使得方差最大时,所对应的索引i,并使即完成阈值自适应选择算法;计算这一步得到的矩阵更新Yk+1=Yk+μk(D-Ak+1-Ek+1)和k=k+1直至收敛。步骤(5)、对时频矩阵进行有效的降维处理,得到12维的和弦特征。通常情况下,规定音符A0处的频率440Hz为基准频率,并通过获得其他音符处的频率值。其中b为音符与A0之间的音程差。然后,通过映射公式来对谐波矩阵A的各个频率成分进行映射,从而获得鲁棒音阶轮廓特征向量。其中x对应矩阵A每一行所对应的频率值,而fref则通过获得。2.如权利要求1所述的一种基于核范数的鲁棒音阶轮廓特征提取算法,其特征在于,所述阈值自适应调整算法该算法包括以下步骤:初始化奇异值截断阈值参数μ,参数λ,迭代索引k=0,临时矩阵Y0=D,E0为全零矩阵;进行奇异值分解得到奇异值矩阵Σ;接着,从μk到1.5μk等间隔选取二十个数据点其中1≤i≤20,对于每个进行奇异值分解逆操作2CN106782583A权利要求书2/2页由于谐波成分只分布在数个频率点上,因此计算矩阵中某一列的方差,并从中选取使得方差最大时,所对应的索引i,并使即完成阈值自适应选择算法;计算这一步得到的矩阵更新Yk+1=Yk+μk(D-Ak+1-Ek+1)和k=k+1直至收敛。3CN106782583A说明书1/4页基于核范数的鲁棒音阶轮廓特征提取算法技术领域[0001]本发明属于计算机听觉系统中的音频信号分析领域,特别是涉及一种音阶轮廓特征提取算法。[0002]本发明提供的方法能