基于谱特征和ELM的语音情感识别方法-豆柴文库

基于谱特征和ELM的语音情感识别方法.pdf

2023-06-25

10金币

688KB

12页

是你****馨呀

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共12页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110827857A(43)申请公布日2020.02.21(21)申请号201911189489.0(22)申请日2019.11.28(71)申请人哈尔滨工程大学地址150001黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室(72)发明人张健沛史芝欣杨静王勇(51)Int.Cl.G10L25/63(2013.01)G10L25/18(2013.01)G10L25/24(2013.01)G10L25/27(2013.01)G10L25/45(2013.01)G10L15/02(2006.01)权利要求书1页说明书7页附图3页(54)发明名称基于谱特征和ELM的语音情感识别方法(57)摘要本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征；利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC，二者加权得到teCMFCC特征，并与基本特征值进行融合，构建特征矩阵；用Fisher准则和相关分析对特征进行选择降维，保留语音信号的个性特征；建立极限学习机ELM决策树模型，完成语音情感识别分类。本发明强调了语音信号的非线性特征，具有很好的鲁棒性，在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验，验证提出的基于谱特征和ELM的语音情感识别算法对中文语音信号具有很好的分类识别精度。CN110827857ACN110827857A权利要求书1/1页1.一种基于谱特征和ELM的语音情感识别方法，其特征是：(1)对原始语音信号进行特征提取获得基本特征值，所述特征包括韵律特征和音质特征；(2)利用Teager能量算子算法在Mel标度频域提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC，得到teMFCC特征值和teCFCC特征值；(3)对teMFCC特征值和teCFCC特征值加权得到teCMFCC特征值，并与基本特征值进行融合，构建特征矩阵；(4)用Fisher准则和相关分析对特征进行选择降维，去除相关互联的冗余特征，提取具有表示情绪能力的情感特征；(5)提出极限学习机-决策树模型进行语音情感识别分类决策任务，最终实现较精确的目标分类识别。2.根据权利要求1所述的基于谱特征和ELM的语音情感识别方法，其特征是：所述韵律特征包括基频、短时平均能量、短时平均振幅、静音时间比、短时平均过零率、语速，所述音质特征包括共振峰频率、呼吸音、响度。3.根据权利要求1所述的基于谱特征和ELM的语音情感识别方法，其特征是：在步骤(2)中，将语音信号通过一个高通滤波器，包括预加重、分帧、加窗函数，对每一帧信号进行FFT变换，计算功率谱，进行TEO变换；得到变换后的TEO系数；将每帧信号的TEO系数经过快速傅里叶变换FFT得到离散频谱，然后计算功率谱；将此功率谱通过MFCC滤波器组滤波，计算对数功率谱；将对数功率谱经过离散余弦变换DCT得到teMFCC特征值。4.根据权利要求3所述的基于谱特征和ELM的语音情感识别方法，其特征是：步骤(2)中将语音信号通过耳蜗滤波器组实现听觉变换，计算功率谱；进行内毛细胞函数变换，将变换后的功率谱值进一步提取TEO系数；将变换得到的TEO系数进行非线性变换；进行DCT变换得到teCFCC特征值。5.根据权利要求4所述的基于谱特征和ELM的语音情感识别方法，其特征是：在步骤(3)中，teCMFCC＝0.6×teMFCC+0.4×teCFCC。6.根据权利要求5所述的基于谱特征和ELM的语音情感识别方法，其特征是：在步骤(4)中利用fisher准则对特征优劣进行排序，然后对其进行相关分析，设置门限值δ为0.78，剔除冗余特征。7.根据权利要求6所述的基于谱特征和ELM的语音情感识别方法，其特征是：在步骤(5)中ELM的激活函数用的sigmoid函数S(x)＝1/1+e-x，实际输出和期望输出之间的误差为：οj表示网络输出层的实际值，tj表示网络输出层的预期值。8.根据权利要求7所述的基于谱特征和ELM的语音情感识别方法，其特征是：步骤(5)中是基于二元决策树分层识别，基于一类情绪与其他类别情绪之间的混淆程度，两组之间的混淆程度为其中Dij代表现有的情绪标记组，DL1,L2表示两组之间混淆程度的平均值。2CN110827857A说明书1/7页基于谱特征和ELM的语音情感识别方法技术领域[0001]本发明涉及的是一种语音情感识别方法，具体地说是一种基于倒谱特征(cepstral-basedspectralfeature)的语音情感识别方法。背景技术[0002]1997年，美国麻省理工学院的Picard教授提出了情感计算(Affectiv

相关资料

基于谱特征和ELM的语音情感识别方法.pdf

本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征；利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC，二者加权得到teCMFCC特征，并与基本特征值进行融合，构建特征矩阵；用Fisher准则和相关分析对特征进行选择降维，保留语音信号的个性特征；建立极限学习机ELM决策树模型，完成语音情感识别分类。本发明强调了语音信号的非线性特征，具有很好的鲁棒性，在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验

2023-06-25

688KB

基于深度学习的语音情感识别方法和装置.pdf

本申请公开了一种基于深度学习的语音情感识别方法和装置，属于语音识别领域。该方法包括：使用梅尔倒谱系数法得到多个训练样本，逐一输入到SVM中进行训练，判断当前训练样本情感识别的准确率，当高于上一训练样本的准确率时，将当前的c和g输入到PSO的适应度函数中，采用迭代方式对PSO进行粒子更新并重新计算适应度函数，直到得到PSO的全局最优解；在多个训练样本全部完成训练后，SVM寻优得到最优化的c和g；当有语音数据待识别时，输入SVM中进行情感识别。该装置包括：获取模块、初始化模块、训练模块、寻优模块和识别模块。本

2023-06-25

850KB

基于短视频语音的情感识别方法和装置.pdf

本申请公开了一种基于短视频语音的情感识别方法和装置，属于语音情感识别技术领域。该方法包括：创建短视频的语音数据集，对语音数据集进行预处理，对预处理后的语音数据进行计算得到梅尔倒谱系数，作为输入送入CNN模型进行训练，得到声学情感类别C1；将预处理后的语音数据转换为文本数据，进行分词、去除停用词和文本特征抽取操作，再使用预训练的LSTM模型进行训练得到语义情感类别C2；按照预设的比重结合C1和C2，得到最终语音情感类别C。该装置包括：创建模块、预处理模块、声学识别模块、语义识别模块和结合模块。本申请扩展了语

2023-06-25

826KB

基于稀疏表示的语音情感特征学习与识别方法研究的中期报告.docx

基于稀疏表示的语音情感特征学习与识别方法研究的中期报告摘要本中期报告研究了基于稀疏表示的语音情感特征学习与识别方法。首先介绍了情感识别的研究背景和现状，然后介绍了稀疏表示的基本概念和方法。接着，提出了基于稀疏表示的情感特征学习与识别方法，包括特征提取、码本学习和分类器训练等环节。最后，以IEMOCAP数据库为例，进行了实验评估，结果表明所提出的方法在情感识别任务中具有较好的性能。AbstractThismidtermreportstudiesthemethodoflearningandrecognizin

2024-09-14

11KB

基于OBSI和特征选择的语音情感识别算法的开题报告.docx

基于OBSI和特征选择的语音情感识别算法的开题报告一、研究背景在人机交互和智能辅助领域，情感识别一直是一个备受关注的热点问题。特别是在现实生活中，人类一直在通过语音来传达自己的情感状态。因此，一种基于语音的情感识别算法具有广泛的应用前景。该算法可以为人类提供更加智能、更加有效的语音交互方式，从而提高人机交互效率和用户体验。目前，基于语音的情感识别算法已经得到了广泛的研究和应用。在这些算法中，OBSI模型和特征选择技术都是非常常见的工具。OBSI模型是一种基于深度学习的模型，能够有效地捕捉语音中的情感信息，

2024-09-17

11KB