预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111739491A(43)申请公布日2020.10.02(21)申请号202010370928.4(22)申请日2020.05.06(71)申请人华南理工大学地址510640广东省广州市天河区五山路381号(72)发明人韦岗刘俊伟曹燕(74)专利代理机构广州市华学知识产权代理有限公司44245代理人詹丽红(51)Int.Cl.G10H1/00(2006.01)G10H1/36(2006.01)G10H1/38(2006.01)权利要求书3页说明书6页附图3页(54)发明名称一种自动编配伴奏和弦的方法(57)摘要本发明公开了一种自动编配伴奏和弦的方法,包括特征提取、模型训练与和弦预测,其中,特征提取是对音乐音频数据的特征提取,针对不同乐器间泛音变化以及音色不均匀带来的和弦识别率低的问题,采用改进的音高级轮廓特征,引入高斯加窗和对数压缩算法,消除泛音以及多重音色带来的负面影响,该方法可增强模型鲁棒性,提高和弦识别率;模型训练需要标签标定与数据训练,通过伴奏音轨符号数据进行和弦信息提取,得到对应的和弦序列,构建为和弦标签文件,并与对应的增强型PCP主旋律特征向量一同输入至隐马尔可夫模型进行参数训练;和弦预测则将待识别的增强型PCP主旋律特征向量输入模型进行预测,最终生成和弦序列。CN111739491ACN111739491A权利要求书1/3页1.一种自动编配伴奏和弦的方法,其特征在于,所述的方法包括下列步骤:S1、对MIDI音频数据进行预处理,删除其中打击乐器音轨,融合相同乐器音轨,得到新的音轨MIDI文件;S2、对MIDI文件分别提取主旋律音轨和伴奏音轨,并对两组音轨序列做C调归一化,对主旋律音轨通过格式转换,转变为主旋律音频数据,伴奏音轨格式保持不变;S3、对所述的主旋律音频数据进行傅里叶变换得到频谱特征,根据乐理中十二平均律,将频域内每个分量展开为十二个频带;针对所有分量得到的十二个频带,将对应同一音级频带的分量相加,进而得到整个频域的十二维PCP音级轮廓特征,再通过高斯加窗,降低高低频权重影响,得到滤波后PCP主旋律特征向量;根据对数压缩算法,以一定压缩比例减小特征空间冗余度,得到增强型PCP主旋律特征向量;S4、提取所述的伴奏音轨的拍速、音长、音高、节奏、调号,通过拍速和节奏的计算,得到伴奏音轨的小节时长,从而将伴奏音轨分割成若干音乐小节;对每个音乐小节进行和声变换,得到和弦根音以及音程关系,该音程关系包括大调、小调,根据调号、和弦根音以及音程关系,构成该音乐小节的和弦序列,进而构建得到整个伴奏音轨的和弦序列;将伴奏音轨的和弦序列以XML的数据格式保存成和弦标签文件;S5、构建36个隐马尔可夫模型,其中,36个隐马尔可夫模型分别对应36种和弦,该36种和弦包括三和弦、五和弦、九和弦、十一和弦、十三和弦以及各自的变形和弦,每个模型状态数为六种,分别是四个活动状态、开始状态和停止状态,其中活动状态的观测函数由单一带对角矩阵的高斯观测函数构成;然后将增强型PCP主旋律特征向量与对应的伴奏音轨的和弦标签文件一同输入至36个隐马尔可夫模型中进行参数训练;S6、提取待识别的主旋律音频数据得到待识别的增强型PCP主旋律特征向量,将待识别的增强型PCP主旋律特征向量输入至已训练的隐马尔可夫模型,预测生成和弦序列。2.根据权利要求1所述的一种自动编配伴奏和弦的方法,其特征在于,所述的步骤S2过程如下:S21、对MIDI文件使用高音轮廓线skyline算法提取主旋律音轨;S22、对MIDI文件使用低音轮廓线landline算法提取伴奏音轨;S23、对主旋律音轨和伴奏音轨序列分别进行C调归一化处理,保证调式统一;S24、对主旋律音轨进行WAV格式音频转换,用于进行增强型PCP主旋律特征提取;S25、伴奏音轨符号数据格式保持不变,用于构建模型的和弦标签文件。3.根据权利要求1所述的一种自动编配伴奏和弦的方法,其特征在于,所述的步骤S3过程如下:S31、将主旋律音频数据通过重复分帧的方式,采用汉明窗函数,相邻两个窗相互重叠半帧长度,进行每窗以采样点数为N=4096的滑动采样,从而通过傅里叶变换得到主旋律音频数据的能量频谱X(k);S32、根据乐理中十二平均律,忽略高八度或低八度的影响,只考虑音乐中最低音阶组的十二个音级的频率值,将频域内每个分量与最低音级的频率值分别对应相除,得到十二个频率比,从而完成将分量展开为十二个频带;针对所有分量得到的十二个频带,将对应同一音级频带的分量相加,进而得到整个频域的十二维PCP主旋律特征向量,公式如下:2CN111739491A权利要求书2/3页其中frel是最低音阶组音级的参考频率值,最低音阶组包括音阶C1、D1、E1、F1、G1