一种基于注意力机制和多任务学习的语音情感识别方法.pdf
光誉****君哥
亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于注意力机制和多任务学习的语音情感识别方法.pdf
本发明的一种基于注意力机制和多任务学习的语音情感识别方法,包括如下步骤:步骤1:获取用于语音情感识别的CASIA汉语情感数据集;步骤2:LSTM_att?MTL语音情感识别模型由特征提取模块、序列建模模块和多任务学习模块组成,将步骤一中语音情感数据输入识别模型进行协同训练;步骤3:由步骤二中通过softmax分类器得到识别结果,计算识别结果与训练集标签的损失函数由此调整损失大小;步骤4:将测试集语音情感数据输入步骤三训练好的网络中,以实现对测试集语音情感数据识别。本发明构建一个LSTM_att?MTL模型
一种基于多任务学习和子域自适应的跨库语音情感识别方法.pdf
本发明提出了一种基于多任务学习和子域自适应的跨库语音情感识别方法,本发明包括以下步骤:首先,源域和目标域提取的高维语音特征分别输入深度自编码网络,压缩特征冗余信息,获取低维情感特征;然后,采用子域自适应算法将低维特征空间分别划分成情感子域特征空间和性别子域特征空间,以此来减小特征分布距离;最后,将情感识别作为主任务,性别识别作为辅助任务,学习更多共性情感信息。本发明提出的方法可以有效提升跨库语音情感识别性能。
基于注意力LSTM和多任务学习的远场语音识别.docx
基于注意力LSTM和多任务学习的远场语音识别基于注意力LSTM和多任务学习的远场语音识别摘要:随着语音交互技术的迅速发展,远场语音识别已经成为语音识别领域的一个重要研究方向。然而,远场语音识别面临着许多挑战,如信噪比低、多说话人干扰等。为了提高远场语音识别的准确性和鲁棒性,本论文提出了一种基于注意力LSTM和多任务学习的方法。首先,利用长短时记忆网络(LSTM)来建模语音信号的时序特征。然后,引入注意力机制来自动选择关键信息,从而提升系统的性能。此外,通过多任务学习的方式,同时训练语音识别和语音增强模型,
基于深度学习的语音情感识别方法和装置.pdf
本申请公开了一种基于深度学习的语音情感识别方法和装置,属于语音识别领域。该方法包括:使用梅尔倒谱系数法得到多个训练样本,逐一输入到SVM中进行训练,判断当前训练样本情感识别的准确率,当高于上一训练样本的准确率时,将当前的c和g输入到PSO的适应度函数中,采用迭代方式对PSO进行粒子更新并重新计算适应度函数,直到得到PSO的全局最优解;在多个训练样本全部完成训练后,SVM寻优得到最优化的c和g;当有语音数据待识别时,输入SVM中进行情感识别。该装置包括:获取模块、初始化模块、训练模块、寻优模块和识别模块。本
基于注意力机制和卷积神经网络的语音抑郁症识别方法.pdf
本发明涉及一种基于注意力机制和卷积神经网络的语音抑郁症识别方法。本发明首先对语音数据进行预处理,对较长的语音数据进行分割,依据的是分割后的片段能够充分包含抑郁症相关的特征。然后对分割后每个片段提取梅尔频谱图,调整其输入到神经网络模型的频谱图尺寸大小,以便模型的训练。之后用预训练好的Alexnet深度卷积神经网络进行权值的微调,提取梅尔频谱图中更高级的语音特征。然后用注意力机制算法,对片段级语音特征进行权重调整,得到句级的语音特征。最后对句级语音特征用SVM分类模型进行抑郁症的分类。本发明方法考虑了和抑郁症