基于短视频语音的情感识别方法和装置.pdf
元容****少女
亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于短视频语音的情感识别方法和装置.pdf
本申请公开了一种基于短视频语音的情感识别方法和装置,属于语音情感识别技术领域。该方法包括:创建短视频的语音数据集,对语音数据集进行预处理,对预处理后的语音数据进行计算得到梅尔倒谱系数,作为输入送入CNN模型进行训练,得到声学情感类别C1;将预处理后的语音数据转换为文本数据,进行分词、去除停用词和文本特征抽取操作,再使用预训练的LSTM模型进行训练得到语义情感类别C2;按照预设的比重结合C1和C2,得到最终语音情感类别C。该装置包括:创建模块、预处理模块、声学识别模块、语义识别模块和结合模块。本申请扩展了语
基于深度学习的语音情感识别方法和装置.pdf
本申请公开了一种基于深度学习的语音情感识别方法和装置,属于语音识别领域。该方法包括:使用梅尔倒谱系数法得到多个训练样本,逐一输入到SVM中进行训练,判断当前训练样本情感识别的准确率,当高于上一训练样本的准确率时,将当前的c和g输入到PSO的适应度函数中,采用迭代方式对PSO进行粒子更新并重新计算适应度函数,直到得到PSO的全局最优解;在多个训练样本全部完成训练后,SVM寻优得到最优化的c和g;当有语音数据待识别时,输入SVM中进行情感识别。该装置包括:获取模块、初始化模块、训练模块、寻优模块和识别模块。本
基于PDAN的跨库语音情感识别方法及装置.pdf
本发明公开了一种基于渐进式分布适配神经网络(ProgressiveDistributionAdaptedNeuralNetworks,PDAN)的跨库语音情感识别方法及装置,方法包括:(1)获取两个语音情感数据库,分别作为训练数据库和测试数据库;(2)提取训练数据库和测试数据库中具有相同情感标签的语音样本,分别作为源域样本和目标域样本,并提样本的语谱图特征;(3)建立基于渐进式分布适配神经网络的跨库语音情感识别模型,此模型以卷积神经网络为主干网络,通过在原始分类损失函数中加入渐进分布适配正则化项来指导网络
视频语音识别方法、装置、设备和存储介质.pdf
本申请提出一种视频语音识别方法、装置、设备和存储介质,涉及语音识别技术领域其中,方法,包括:对视频进行处理,获取多个音频子片段,以及与每个音频子片段对应的图像帧序列;对图像帧序列进行文本识别,获取多个文本结果,并对多个文本结果进行处理,获取多个关键词;通过语音识别模型对每个音频子片段进行处理,获取多个候选语音识别结果;根据多个候选语音识别结果和多个关键词确定每个音频子片段的目标文本识别结果,根据每个音频子片段的目标文本识别结果,获取视频的语音识别结果。由此,通过视频的图像中的文本识别结果辅助视频语音识别,
基于谱特征和ELM的语音情感识别方法.pdf
本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征;利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC,二者加权得到teCMFCC特征,并与基本特征值进行融合,构建特征矩阵;用Fisher准则和相关分析对特征进行选择降维,保留语音信号的个性特征;建立极限学习机ELM决策树模型,完成语音情感识别分类。本发明强调了语音信号的非线性特征,具有很好的鲁棒性,在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验