预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109256150A(43)申请公布日2019.01.22(21)申请号201811186572.8G10L17/18(2013.01)(22)申请日2018.10.12G10L25/24(2013.01)(71)申请人北京创景咨询有限公司地址100089北京市海淀区苏州街18号长远天地大厦B1座1704室申请人徐心(72)发明人徐心胡宇澄王麒铭饶鹏(74)专利代理机构北京纽乐康知识产权代理事务所(普通合伙)11210代理人白明珠(51)Int.Cl.G10L25/63(2013.01)G10L17/00(2013.01)G10L17/02(2013.01)G10L17/04(2013.01)权利要求书2页说明书7页附图2页(54)发明名称基于机器学习的语音情感识别系统及方法(57)摘要本发明公开了基于机器学习的语音情感识别系统及方法,包括录音降噪模块;断句模块,用于接收录音降噪模块传输过来的录音数据,根据语音学的相关特征将录音数据切割成片段;说话人识别模块,用于接收断句模块传输过来的片段,利用机器学习算法将片段分类,并根据分类对说话人进行识别;特征提取模块,用于接收断句模块传输过来的片段,对每个片段提取频谱特征及梅尔倒谱系数,并在其上进行处理后提取片段特征;情感识别模块,用于接收特征提取模块生成的片段特征,通过机器学习算法对情感预测模型进行训练,并利用集成算法对每个模型的预测结果进行集成。本发明有益效果:有效的在中文语言环境和客户服务电话的实际生产环境中得到良好的表现。CN109256150ACN109256150A权利要求书1/2页1.一种基于机器学习的语音情感识别系统,其特征在于,包括录音降噪模块、断句模块、说话人识别模块、特征提取模块和情感识别模块,其中,录音降噪模块,用于获取录音数据,利用相关算法对录音数据进行降噪预处理;断句模块,用于接收录音降噪模块传输过来的录音数据,根据语音学的相关特征将录音数据切割成片段;说话人识别模块,用于接收断句模块传输过来的片段,利用机器学习算法将片段分类,并根据分类对说话人进行识别;特征提取模块,用于接收断句模块传输过来的片段,对每个片段提取频谱特征及梅尔倒谱系数,并在其上进行处理后提取片段特征;情感识别模块,用于接收特征提取模块生成的片段特征,通过机器学习算法对情感预测模型进行训练,并利用集成算法对每个模型的预测结果进行集成。2.根据权利要求1所述的基于机器学习的语音情感识别系统,其特征在于,所述录音降噪模块中降噪预处理包括:训练学习模块,用于输入一个有损的数据,利用有损数据进行训练学习;输出模块,用于将未被损坏的数据作为深度学习算法的输出;第一处理模块,用于根据训练好的模型对其他有损数据进行处理。3.根据权利要求1所述的基于机器学习的语音情感识别系统,其特征在于,所述说话人识别模块包括:分类模块,用于利用不同建模方法将录音数据中的不同片段和语音帧分为两类或者多类;第一集成模块,用于对各个模型的分类结果进行集成,对不同说话人的语音片段的实时及批量的分类标记。4.根据权利要求3所述的基于机器学习的语音情感识别系统,其特征在于,所述特征提取模块包括:提取模块,用于将各个模型根据其建模需要提取各类不同的特征指标;第二处理模块,用于对梅尔倒谱系数的不同维度指标进行加工处理生成识别特征;转换模块,用于通过原始语音时域信号,以及其转换生成的语谱图进行图像特征的提取。5.根据权利要求3或4所述的基于机器学习的语音情感识别系统,其特征在于,所述情感识别模块包括:输入模块,用于将训练样本利用提取出来的各类特征,输入到不同的机器学习算法模型中进行训练学习;第二集成模块,用于将各个模型训练后得到的不同预测结果进行集成;预测模块,用于通过调整不同模型得到不同应用场景下预测效果最终的整体模型,利用最终的整体模型预测其他未知的片段情感。6.一种基于机器学习的语音情感识别方法,其特征在于,包括以下步骤:S1获取录音数据,利用相关算法对录音数据进行降噪预处理;S2接收录音降噪模块传输过来的录音数据,根据语音学的相关特征将录音数据切割成片段;2CN109256150A权利要求书2/2页S3接收断句模块传输过来的片段,利用机器学习算法将片段分类,并根据分类对说话人进行识别;S4接收断句模块传输过来的片段,对每个片段提取频谱特征及梅尔倒谱系数,并在其上进行处理后提取片段特征;S5接收特征提取模块生成的片段特征,通过机器学习算法对情感预测模型进行训练,并利用集成算法对每个模型的预测结果进行集成。7.根据权利要求6所述的基于机器学习的语音情感识别方法,其特征在于,所述步骤S1中降噪预处理包括:S11输入一个有损的数据,利用有损数据进行训练学习;S1