预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114078484A(43)申请公布日2022.02.22(21)申请号202010833052.2(22)申请日2020.08.18(71)申请人北京有限元科技有限公司地址100080北京市海淀区王庄路1号B座23层27-整层270(72)发明人孟庆林吴海英蒋宁王洪斌赵立军(74)专利代理机构北京万思博知识产权代理有限公司11694代理人刘冀(51)Int.Cl.G10L25/63(2013.01)G10L25/30(2013.01)G10L25/24(2013.01)权利要求书2页说明书10页附图3页(54)发明名称语音情绪识别的方法、装置以及存储介质(57)摘要本申请公开了一种语音情绪识别的方法、装置以及存储介质,其中语音情绪识别的方法,包括:获取与待识别情绪的目标对象相关的语音信息;以及利用预设的识别模型对语音信息进行情绪识别,确定目标对象的情绪类别,其中识别模型包括残差网络和门控循环单元。通过利用包括残差网络和门控循环单元的识别模型进行目标对象的语音情绪识别,有效提升了识别模型的特征映射能力与序列处理能力,达到了提升情绪识别准确率以及语音情绪识别效率的技术效果。CN114078484ACN114078484A权利要求书1/2页1.一种语音情绪识别的方法,其特征在于,包括:获取与待识别情绪的目标对象相关的语音信息;以及利用预设的识别模型对所述语音信息进行情绪识别,确定所述目标对象的情绪类别,其中所述识别模型包括残差网络和门控循环单元。2.根据权利要求1所述的方法,其特征在于,所述识别模型还包括特征提取网络和分类器,并且利用预设的识别模型对所述语音信息进行情绪识别,确定所述目标对象的情绪类别的操作,包括:利用所述特征提取网络对所述语音信息进行特征提取,生成梅尔频谱图特征、一阶差分特征和二阶差分特征;利用所述残差网络对所述梅尔频谱图特征、所述一阶差分特征和所述二阶差分特征进行特征映射,生成序列特征;利用所述门控循环单元,对所述序列特征进行编码处理;以及将编码处理后的所述序列特征输入所述分类器,根据所述分类器的输出结果确定所述目标对象的情绪类别。3.根据权利要求2所述的方法,其特征在于,所述识别模型还包括注意力机制层和全连接层,并且将编码处理后的所述序列特征输入所述分类器的操作之前,还包括:将编码处理后的所述序列特征输入所述注意力机制层进行序列对齐;以及将序列对齐后的所述序列特征输入所述全连接层。4.根据权利要求1所述的方法,其特征在于,获取与待识别情绪的目标对象相关的语音信息的操作,包括:获取坐席与所述目标对象之间的对话录音信息;以及对所述对话录音信息进行声道分离,将单声道的录音信息确定为与待识别情绪的目标对象相关的语音信息。5.根据权利要求3所述的方法,其特征在于,还包括通过以下操作对所述识别模型进行训练:获取多个样本对话录音数据,其中所述样本对话录音数据中包含坐席录音数据和用户录音数据;构建所述识别模型,其中所述识别模型包括所述特征提取网络、所述残差网络、所述门控循环单元、所述注意力机制层和所述分类器;利用所述识别模型,分别输出所述多个样本对话录音数据中包含的对象的情绪类别;以及将所输出的情绪类别与预先设置的与所述多个样本对话录音数据对应的标注情绪类别进行比较,并且根据比较的结果调节所述识别模型,其中所述标注情绪类别用于指示所述样本对话录音数据中包含的对象的实际情绪类别。6.根据权利要求5所述的方法,其特征在于,将所输出的情绪类别与预先设置的与所述多个样本对话录音数据对应的标注情绪类别进行比较的操作,包括:计算所输出的情绪类别与所述标注情绪类别之间的交叉熵损失函数的值,以及根据比较的结果调节所述识别模型的操作,包括:根据交叉熵损失函数的值,对所述识2CN114078484A权利要求书2/2页别模型进行调节。7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至6中任意一项所述的方法。8.一种语音情绪识别的装置,其特征在于,包括:获取模块,用于获取与待识别情绪的目标对象相关的语音信息;以及情绪识别模块,用于利用预设的识别模型对所述语音信息进行情绪识别,确定所述目标对象的情绪类别,其中所述识别模型包括残差网络和门控循环单元。9.根据权利要求8所述的装置,其特征在于,所述识别模型还包括特征提取网络和分类器,并且所述情绪识别模块包括:第一生成子模块,用于利用所述特征提取网络对所述语音信息进行特征提取,生成梅尔频谱图特征、一阶差分特征和二阶差分特征;第二生成子模块,用于利用所述残差网络对所述梅尔频谱图特征、所述一阶差分特征和所述二阶差分特征进行特征映射,生成序列特征;编码处理子模块,用于利用所述门控循环