预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110827857A(43)申请公布日2020.02.21(21)申请号201911189489.0(22)申请日2019.11.28(71)申请人哈尔滨工程大学地址150001黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室(72)发明人张健沛史芝欣杨静王勇(51)Int.Cl.G10L25/63(2013.01)G10L25/18(2013.01)G10L25/24(2013.01)G10L25/27(2013.01)G10L25/45(2013.01)G10L15/02(2006.01)权利要求书1页说明书7页附图3页(54)发明名称基于谱特征和ELM的语音情感识别方法(57)摘要本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征;利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC,二者加权得到teCMFCC特征,并与基本特征值进行融合,构建特征矩阵;用Fisher准则和相关分析对特征进行选择降维,保留语音信号的个性特征;建立极限学习机ELM决策树模型,完成语音情感识别分类。本发明强调了语音信号的非线性特征,具有很好的鲁棒性,在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验,验证提出的基于谱特征和ELM的语音情感识别算法对中文语音信号具有很好的分类识别精度。CN110827857ACN110827857A权利要求书1/1页1.一种基于谱特征和ELM的语音情感识别方法,其特征是:(1)对原始语音信号进行特征提取获得基本特征值,所述特征包括韵律特征和音质特征;(2)利用Teager能量算子算法在Mel标度频域提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC,得到teMFCC特征值和teCFCC特征值;(3)对teMFCC特征值和teCFCC特征值加权得到teCMFCC特征值,并与基本特征值进行融合,构建特征矩阵;(4)用Fisher准则和相关分析对特征进行选择降维,去除相关互联的冗余特征,提取具有表示情绪能力的情感特征;(5)提出极限学习机-决策树模型进行语音情感识别分类决策任务,最终实现较精确的目标分类识别。2.根据权利要求1所述的基于谱特征和ELM的语音情感识别方法,其特征是:所述韵律特征包括基频、短时平均能量、短时平均振幅、静音时间比、短时平均过零率、语速,所述音质特征包括共振峰频率、呼吸音、响度。3.根据权利要求1所述的基于谱特征和ELM的语音情感识别方法,其特征是:在步骤(2)中,将语音信号通过一个高通滤波器,包括预加重、分帧、加窗函数,对每一帧信号进行FFT变换,计算功率谱,进行TEO变换;得到变换后的TEO系数;将每帧信号的TEO系数经过快速傅里叶变换FFT得到离散频谱,然后计算功率谱;将此功率谱通过MFCC滤波器组滤波,计算对数功率谱;将对数功率谱经过离散余弦变换DCT得到teMFCC特征值。4.根据权利要求3所述的基于谱特征和ELM的语音情感识别方法,其特征是:步骤(2)中将语音信号通过耳蜗滤波器组实现听觉变换,计算功率谱;进行内毛细胞函数变换,将变换后的功率谱值进一步提取TEO系数;将变换得到的TEO系数进行非线性变换;进行DCT变换得到teCFCC特征值。5.根据权利要求4所述的基于谱特征和ELM的语音情感识别方法,其特征是:在步骤(3)中,teCMFCC=0.6×teMFCC+0.4×teCFCC。6.根据权利要求5所述的基于谱特征和ELM的语音情感识别方法,其特征是:在步骤(4)中利用fisher准则对特征优劣进行排序,然后对其进行相关分析,设置门限值δ为0.78,剔除冗余特征。7.根据权利要求6所述的基于谱特征和ELM的语音情感识别方法,其特征是:在步骤(5)中ELM的激活函数用的sigmoid函数S(x)=1/1+e-x,实际输出和期望输出之间的误差为:οj表示网络输出层的实际值,tj表示网络输出层的预期值。8.根据权利要求7所述的基于谱特征和ELM的语音情感识别方法,其特征是:步骤(5)中是基于二元决策树分层识别,基于一类情绪与其他类别情绪之间的混淆程度,两组之间的混淆程度为其中Dij代表现有的情绪标记组,DL1,L2表示两组之间混淆程度的平均值。2CN110827857A说明书1/7页基于谱特征和ELM的语音情感识别方法技术领域[0001]本发明涉及的是一种语音情感识别方法,具体地说是一种基于倒谱特征(cepstral-basedspectralfeature)的语音情感识别方法。背景技术[0002]1997年,美国麻省理工学院的Picard教授提出了情感计算(Affectiv