预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102664018A*(12)发明专利申请(10)申请公布号CN102664018A(43)申请公布日2012.09.12(21)申请号201210127133.6(22)申请日2012.04.26(71)申请人杭州来同科技有限公司地址310030浙江省杭州市西湖区绿城紫金广场C座1001室(72)发明人林裕旭刘康苗刘迪搏张恺(74)专利代理机构杭州赛科专利代理事务所33230代理人陈辉(51)Int.Cl.G10L19/00(2006.01)G10L15/10(2006.01)权利要求书权利要求书1页1页说明书说明书33页页附图附图11页(54)发明名称基于径向基函数统计模型的演唱评分方法(57)摘要本发明公开了一种基于径向基函数统计模型的演唱评分方法。传统的演唱评分方法通过比对目标音频与参考音频的声学特征差异进行评分,其缺陷在于:使用不同的参考音频将得到迥异的评分结果。本发明提出一种基于径向基函数统计模型的演唱评分方法,采集标准样本不同的参考音频并提取声学特征,包括梅尔倒谱系数特征、线性预测系数、基频特征,使用这些特征训练得到基于径向基函数统计模型,再利用该模型计算目标音频的对数概率矩阵,最后使用动态规整计算最佳匹配对数概率,能得到更精确而稳定的评分。CN102648ACN102664018A权利要求书1/1页1.基于径向基函数统计模型的演唱评分方法,其特征在于,包括以下步骤:(1)预处理,包括如下步骤:制作特征库:采集同一歌曲的若干参考音频样本,即同一歌手在不同时期的录音及不同歌手的录音,记为{Si},将样本分割成时间长度为T、前后重叠时间长度一致的音频段,记为提取音频段的短时信号特征,包括梅尔倒谱系数特征、线性预测系数、基频特征,记为建立统计模型并训练:建立各段音频对应的径向基函数统计模型:Pj(X)=R(Dj(X))其中,R为单调递减径向基函数;μj为各音频样本的第j段音频均值;σj为第j段音频的协方差矩阵,代表样本在空间中的分布;Dj(X)为输入向量X与音频均值的马氏距离,该距离计算方法用于归一化特征向量在不同方向上长度;Pj(X)为第j段音频对应的径向基函数统计模型;通过如下计算μj与σj:其中,n代表参考音频样本的数量,i表示第i个参考音频样本;(2)目标音频评分,包括如下步骤:提取目标音频实时特征:将目标音频实时分割成时间长度为T、前后重叠时间长度一致的音频段音频段,记为{Dj},提取音频段的短时信号特征,包括梅尔倒谱系数特征、线性预测系数、基频特征,记为{Gj};建立对数概率矩阵:评分系统每隔L个音频段对目标音频进行评分,每次评分前建立目标音频特征与统计模型的对数概率矩阵:Mk(x,y)=Log(Pk*L-v+x(Gk*L+y))x∈[0,L+2v)y∈[0,L)Mk(x,y)表示第k次评分的对数概率矩阵中下标为(x,y)的元素值,v为偏差忍受值,即允许演唱者的节奏相对特征库提前或滞后v个音频段;动态规整匹配:使用对数概率矩阵Mk作为标准动态规整算法的输入,得到目标音频段相对于统计模型的最佳匹配对数概率,记为bk,通过如下正规化公式输出第k次评判分数pk:使用所有实时评判分数的均值作为目标音频的总体评判分数。2.如权利要求1所述的基于径向基函数统计模型的演唱评分方法,其特征在于,步骤(1)的所述的单调递减径向基函数为高斯函数或样条函数。2CN102664018A说明书1/3页基于径向基函数统计模型的演唱评分方法技术领域[0001]本发明涉及演唱评分领域,特别是涉及一种基于径向基函数统计模型的演唱评分方法。背景技术[0002]演唱评分方法主要用于卡拉0K装置或软件,目的是对演唱者的声音作评价,增加歌唱乐趣。[0003]传统的演唱评分方法通过比对目标音频与参考音频的声学特征差异进行评分,其缺陷在于:使用不同的参考音频将得到迥异的评分结果。发明内容[0004]为了克服现有技术的不足,本发明公开了一种基于径向基函数统计模型的演唱评分方法。[0005]本发明采用了如下的技术方案:[0006]一种基于径向基函数统计模型的演唱评分方法,其特征在于,包括以下步骤:[0007](1)预处理,包括如下步骤:[0008]制作特征库:采集同一歌曲的若干参考音频样本,即同一歌手在不同时期的录音及不同歌手的录音,记为{Si},将样本分割成相互重叠时间长度为T的音频段,记为提取音频段的短时信号特征,包括梅尔倒谱系数特征、线性预测系数、基频特征,记为[0009]建立统计模型并训练:建立各段音频对应的径向基函数统计模型:[0010]Pj(X)=R(Dj(X))[0011][0012]其中,R为单调递减径向基函数;μj为各音频样本的第j段音频均值;σj为第j段音频的协方差矩阵,代表样本在空间中的分布;