预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110491417A(43)申请公布日2019.11.22(21)申请号201910736256.1G06N20/10(2019.01)(22)申请日2019.08.09(71)申请人北京影谱科技股份有限公司地址100000北京市朝阳区朝外大街22号5层521室(72)发明人郑若冰(74)专利代理机构北京万思博知识产权代理有限公司11694代理人高镇(51)Int.Cl.G10L25/63(2013.01)G10L25/24(2013.01)G10L25/27(2013.01)G06K9/62(2006.01)G06N3/00(2006.01)权利要求书2页说明书7页附图4页(54)发明名称基于深度学习的语音情感识别方法和装置(57)摘要本申请公开了一种基于深度学习的语音情感识别方法和装置,属于语音识别领域。该方法包括:使用梅尔倒谱系数法得到多个训练样本,逐一输入到SVM中进行训练,判断当前训练样本情感识别的准确率,当高于上一训练样本的准确率时,将当前的c和g输入到PSO的适应度函数中,采用迭代方式对PSO进行粒子更新并重新计算适应度函数,直到得到PSO的全局最优解;在多个训练样本全部完成训练后,SVM寻优得到最优化的c和g;当有语音数据待识别时,输入SVM中进行情感识别。该装置包括:获取模块、初始化模块、训练模块、寻优模块和识别模块。本申请提高了语音情感识别的精度和准确率。CN110491417ACN110491417A权利要求书1/2页1.一种基于深度学习的语音情感识别方法,包括:使用梅尔倒谱系数法得到多个训练样本;初始化支持向量机SVM的惩罚因子c和核函数参数g;将所述多个训练样本逐一输入到所述初始化后的SVM中进行训练,判断当前训练样本情感识别的准确率,当高于上一个训练样本情感识别的准确率时,将当前的惩罚因子c和核函数参数g输入到粒子群优化算法PSO的适应度函数中,计算得到适应度函数值,采用迭代方式对所述PSO进行粒子更新并重新计算所述适应度函数,直到得到所述PSO的全局最优解,完成所述当前训练样本的训练;在所述多个训练样本全部完成训练后,所述SVM寻优得到最优化的惩罚因子c和核函数参数g;当有语音数据待识别时,将所述语音数据输入所述寻优后的SVM中进行情感识别。2.根据权利要求1所述的方法,其特征在于,所述判断当前训练样本情感识别的准确率,包括:对当前训练样本中包含的每一个情感类别,将所述SVM识别的结果与所述当前训练样本中包含的情感类别标识进行比对,统计出所述所有情感类别中识别正确的个数,再除以所述所有情感类别的总数,得到所述当前训练样本情感识别的准确率。3.根据权利要求1所述的方法,其特征在于,所述采用迭代方式对所述PSO进行粒子更新并重新计算所述适应度函数,直到得到所述PSO的全局最优解,包括:重复对所述PSO进行粒子更新及重新计算所述适应度函数,并以指定概率重新初始化当前粒子的位置和速度,直到所述当前粒子的个体极值与所述PSO的全局最优解相等。4.根据权利要求1所述的方法,其特征在于,所述使用梅尔倒谱系数法得到训练样本,包括:预先将情感类别划分为喜、怒、哀、乐四类,并分别设置对应的标识;根据MFCC法在语音数据中提取情感特征数据,在所述情感特征数据前添加所述语音数据所属情感类别所对应的标识,得到包含情感类别标识的训练样本。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:在使用所述SVM进行训练之前,对所述多个训练样本进行归一化处理,消除不同特征之间的量纲。6.一种基于深度学习的语音情感识别装置,包括:获取模块,其配置成使用梅尔倒谱系数法得到多个训练样本;初始化模块,其配置成初始化支持向量机SVM的惩罚因子c和核函数参数g;训练模块,其配置成将所述多个训练样本逐一输入到所述初始化后的SVM中进行训练,判断当前训练样本情感识别的准确率,当高于上一个训练样本情感识别的准确率时,将当前的惩罚因子c和核函数参数g输入到粒子群优化算法PSO的适应度函数中,计算得到适应度函数值,采用迭代方式对所述PSO进行粒子更新并重新计算所述适应度函数,直到得到所述PSO的全局最优解,完成所述当前训练样本的训练;寻优模块,其配置成在所述多个训练样本全部完成训练后,所述SVM寻优得到最优化的惩罚因子c和核函数参数g;识别模块,其配置成当有语音数据待识别时,将所述语音数据输入所述寻优后的SVM中2CN110491417A权利要求书2/2页进行情感识别。7.根据权利要求6所述的装置,其特征在于,所述训练模块具体配置成:对当前训练样本中包含的每一个情感类别,将所述SVM识别的结果与所述当前训练样本中包含的情感类别标识进行比对,统计出所述所有情感类