预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于特征提取多模式结合的语音情感识别的研究的中期报告 一、论文中期进展总结: 本文主要是基于特征提取和多模式结合的方法,实现对语音情感的识别,已经完成了以下研究工作: 1.语音情感识别的数据采集。收集语音情感数据库,每个情感类别包含100个句子,共有5个情感类别。 2.语音信号预处理。对录制的语音信号进行预处理,包括去除噪声和增强信号。 3.特征提取。采用Mel频率倒谱系数(MFCC)和线性预测编码(LPC)两种特征提取方法,提取语音信号的特征。 4.特征处理。将MFCC和LPC特征进行归一化处理,将不同特征融合成一个特征向量。 5.多模式结合。采用支持向量机(SVM)和多层感知机(MLP)两种模式进行分类,将结果进行综合。 二、问题分析和解决措施: 1.数据库的采集难度比较大,数据量不够。可以考虑增大数据量,同时融合其他多种数据集。 2.特征提取方法需要进一步优化。可以考虑引入其他特征提取方法,比如基于时域的短时能量、语调等方法,或者基于频域的功率谱密度等方法,进一步提高分类的准确度。 3.模式设计需要优化。可以考虑采用其他分类器,或者进行特征选择和降维等方法,提高分类的准确度和效率。 三、下一步研究计划: 在解决以上问题的基础上,下一步的研究计划如下: 1.研究采用其他特征提取方法,比如基于时域的短时能量、语调等方法,或者基于频域的功率谱密度等方法,进一步提高分类的准确度。 2.采用其他分类器,或者进行特征选择和降维等方法,优化模式的设计,提高分类的准确度和效率。 3.对多模式结合的方法进行进一步研究,探索更好的融合方式,提高分类效果。