预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107909090A(43)申请公布日2018.04.13(21)申请号201710942785.8(22)申请日2017.10.11(71)申请人天津大学地址300072天津市南开区卫津路92号(72)发明人闫晗晗李锵关欣(74)专利代理机构天津市北洋有限责任专利代理事务所12201代理人刘国威(51)Int.Cl.G06K9/62(2006.01)权利要求书2页说明书8页附图2页(54)发明名称基于测度学习半监督的钢琴乐谱难度识别方法(57)摘要本发明属于机器学习、乐谱自动识别技术,为实现具有适应乐谱数据变化的能力,并具有高的识别稳定性和识别准确率,为钢琴教学和学习过程,提供可靠的钢琴难度等级信息。为此,本发明,基于测度学习半监督的钢琴乐谱难度识别方法,包括下列步骤:1)收集具有难度标签的实验数据源即两种不同评价体系下的数据集;2)对提取到的特征数据进行归一化预处理、数据清洗,解决数据不平衡问题,并评估难度相关特征的有效性;3)对其中一个数据集进行基于测度学习理论的有监督算法分类,获到分类正确率;4)现已收集两个评价体系的数据集;5)利用其中一个评价体系下的数据去提升另一个评价体系下的数据集分类正确率。本发明主要应用于乐谱识别场合。CN107909090ACN107909090A权利要求书1/2页1.一种基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,包括下列步骤:1)收集具有难度标签的实验数据源即两种不同评价体系下的数据集,针对难度等级要求有目的地采集难度相关特征,构成表征难度的特征向量,最后形成难度相关特征空间;2)对提取到的特征数据进行归一化预处理、数据清洗,解决数据不平衡问题,并评估难度相关特征的有效性;3)对其中一个数据集进行基于测度学习理论的有监督算法分类,获到分类正确率;4)现已收集两个评价体系的数据集,不使用其中一个数据集的标签信息,利用此评价体系的数据去提升另一个评价体系下的数据集分类正确率;5)学习两个评价体系下的数据集间联系,利用其中一个评价体系下的数据去提升另一个评价体系下的数据集分类正确率。2.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤1)具体地,针对乐谱难度等级问题有目的的采集不同难度标签的钢琴乐谱数据集,并根据人为判断乐谱难度等级的准则,并结合数字乐谱相关信息,提取表征难度的特征向量,构成特征空间,并给数据集进行难度等级编号分别为1~m,m为自然数。3.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤2)具体地,用Min-Max归一化方法,公式如下:将特征向量的值归一化到[0,1]区间,其中min和max分别表示特征xi的最小和最大值,表示特征xi经过归一化处理后的特征;采用过采样oversampling方法解决数据不平衡问题,即重复利用数据较少的类别,以使得和数据多的类别之间达到平衡。4.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤3)具体地,从每个类别中随机选取80%作为训练样本,其余作为测试样本,将80%的五类难T度等级数据集的标签信息根据测度学习有监督的得到新的距离测度DM=(xi-xj)M(xi-xj),并用新的距离测度改进高斯径向基核函数,求解最优超平面的问题即为求解下列目标函数:0≤αi≤C,i=1,...,p其中其中α是拉格朗日系数,C是错误分类的惩罚参数,KM是改进后的高斯径向基核函数,核函数表达式中的DM(xi,xj)是测度学习得到的距离测度,求解目标函数得到最优解选择α*的一个小于C的正分量并据此计算:2CN107909090A权利要求书2/2页并用one-versus-all方法将SVM扩展到多分类,基于网格搜索算法选择最优的核函数参数,建立多分类支持向量机模型,并对于待识别数字乐谱利用训练好的分类模型根据重新构造的决策函数判断出剩余20%待分类数字乐谱所属的难度等级,并得到分类正确率。5.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤4)具体地,在步骤3中学习到多分类支持向量机模型,向此模型中输入NineS数据集的特征,即对NineS数据集进行五类难度等级标签的分类,得到五类难度等级标签的NineS数据集和80%的FiveS数据集的标签信息重复步骤3中的有监督学习过程,重新学习距离测度,建立新的多分类支持向量机模型,最后对20%的FiveS数据集利用新训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到新的分类正确率。6.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤5)具体地,对NineS数据集和FiveS数据集都进