预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106941005A(43)申请公布日2017.07.11(21)申请号201710101549.3(22)申请日2017.02.24(71)申请人华南理工大学地址510640广东省广州市天河区五山路381号(72)发明人李艳雄李先苦张聿晗张雪(74)专利代理机构广州市华学知识产权代理有限公司44245代理人李斌(51)Int.Cl.G10L21/0208(2013.01)G10L25/03(2013.01)G10L25/24(2013.01)G10L25/66(2013.01)A61B5/00(2006.01)权利要求书5页说明书11页附图1页(54)发明名称一种基于语音声学特征的声带异常检测方法(57)摘要本发明公开了一种基于语音声学特征的声带异常检测方法,步骤如下:首先从每帧语音中提取梅尔频率倒谱系数MFCC,基频F0,基频微扰Jitter,振幅微扰Shimmer,谐噪比HNR;然后以声学特征作为输入,采用期望最大化EM算法分别训练代表声带异常和声带正常的高斯混合模型θA和θN;最后将测试语音的特征矩阵F分别输入高斯混合模型θA和θN,得到相应的输出概率P(F|θA)和P(F|θN),如果P(F|θA)>P(F|θN),则测试语音的说话人声带异常,否则正常。本发明采用测试者发出的语音作为分析对象,并从测试语音中提取能有效反应声带情况的多组声学特征作为高斯混合模型的输入,有效区分了声带正常和异常的语音,从而诊断测试者声带是否异常,具有非入侵、便利、成本低等优点。CN106941005ACN106941005A权利要求书1/5页1.一种基于语音声学特征的声带异常检测方法,其特征在于,包括如下步骤:S1、读取语音:读入语音样本,得到语音序列S(n);S2、预处理:对语音数据进行预加重、分帧、加窗和去静音处理,得到语音帧St(n),1≤t≤T,其中T表示语音帧数;S3、提取声学特征:从语音帧St(n)中提取梅尔频率倒谱系数MFCC,基频F0,基频微扰Jitter,振幅微扰Shimmer,谐噪比HNR,得到特征矩阵F=[梅尔频率倒谱系数MFCC,基频F0,基频微扰Jitter,振幅微扰Shimmer,谐噪比HNR];S4、训练高斯混合模型GMM:以特征矩阵F作为输入,采用期望最大化EM算法分别训练代表声带异常和声带正常的高斯混合模型θA和θN;S5、声带异常判决:将测试语音的特征矩阵F分别输入高斯混合模型θA和θN,得到相应的输出概率P(F|θA)和P(F|θN),如果P(F|θA)>P(F|θN),则测试语音的说话人声带异常,否则正常。2.根据权利要求1所述的一种基于语音声学特征的声带异常检测方法,其特征在于,步骤S2中预处理包括如下步骤:S2.1、预加重:利用数字滤波器h(n)对语音数据进行滤波处理,h(n)的Z变换H(z)表示为:H(z)=1-μz-1,其中μ取0.98;S2.2、分帧:将预加重后的语音数据进行分帧处理,设置语音帧的帧长L,帧移S;S2.3、加窗:将每帧语音St(n)与窗函数相乘,其中窗函数为汉明窗ω(n):其中N表示一帧语音的采样点数,且N=L×fs,其中fs表示语音采样频率;S2.4、去静音:S2.4.1、计算第t帧语音St(n)的能量Et:得到语音流的能量特征矢量E=[E1,E2,…,ET],其中T为总帧数;S2.4.2、用固定的能量门限判断静音与语音有很大的局限性,因为各种环境下的语音能量相差很大,但语音与静音之间能量大小的相对关系是不变的,所以定义每帧语音的能量门限TE:TE=min(E)+0.3×[mean(E)-min(E)]其中,min(E)是各帧能量的最小值,mean(E)是各帧能量的平均值;S2.4.3、将每帧语音的能量与能量门限比较,低于能量门限的帧为静音帧,否则为语音帧,舍弃静音帧,保留语音帧。3.根据权利要求1所述的一种基于语音声学特征的声带异常检测方法,其特征在于,步骤S3中提取声学特征的步骤包括:2CN106941005A权利要求书2/5页S3.1、提取梅尔频率倒谱系数MFCC,具体步骤如下:S3.1.1、对第t帧语音St(n)做离散傅立叶变换DFT,得到线性频谱St(k):S3.1.2、将上述线性频谱St(k)通过梅尔滤波器组滤波得到梅尔频谱,再进行对数运算得到对数频谱St(m),其中梅尔滤波器组为若干个带通滤波器Hm(k),0≤m≤M,M为滤波器的个数,每个滤波器具有三角形滤波特性,中心频率为f(m),m较小时相邻f(m)的间隔较小,m增加时相邻f(m)的间隔变大,每个带通滤波器的传递函数为:其中,f(m)定义如下:其中fl和fh分别为滤波器频率应用范围的最低和最高频率,N为一帧语音的采样点数,-1