基于注意力的复数卷积神经网络语音增强方法及系统.pdf
雨巷****莺莺
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于注意力的复数卷积神经网络语音增强方法及系统.pdf
本发明提供一种基于注意力的复数卷积神经网络语音增强方法及系统,其特征在于:针对带有背景噪音的语音进行降噪从而实现对语音的增强,包括使用通道时频注意力机制捕捉时频域的语音分布;使用门控时间卷积网络GTCN进行时间建模,从而减少网络的参数、提高网络的训练速度;使用亚像素卷积对实现对纯净语音的重构,避免反卷积时造成的棋盘伪影。本发明有效的提升了网络降噪效果,降低语音信号中的噪声影响,从而提高了语音的可懂度和质量。
一种基于注意力机制和卷积神经网络的单通道语音增强方法.pdf
本发明公开了一种基于注意力机制和卷积神经网络的单通道语音增强方法,包括训练阶段和增强阶段:训练阶段:首先将噪声与纯净语音合成带噪语音,接着对带噪语音进行特征提取,然后将纯净语音与特征提取后的带噪语音一并送入神经网络模型中学习带噪语音和纯净语音之间的映射关系,训练阶段结束后,将训练好的模型保存下来;增强阶段:首先对带噪语音进行特征提取,然后送入训练好的模型中进行语音增强,最后输出增强后的语音。本发明的基于注意力机制和卷积神经网络的单通道语音增强方法可直接在时域上对带噪语音进行增强,不但可以节省傅里叶变换的计
基于全卷积神经网络的语音增强方法、装置及存储介质.pdf
本发明属于人工智能领域,本发明公开了一种基于全卷积神经网络的语音增强方法,包括:构建全卷积神经网络模型,所述全卷积神经网络模型包括输入层、隐含层和输出层,所述隐含层为多个卷积层,每个卷积层均具有多个滤波器;训练所述全卷积神经网络模型;将原始语音信号输入经过训练的全卷积神经网络模型;输出增强语音信号。本发明的全卷积神经网络模型中,删除了全连接层,仅包含卷积层,大大减小了神经网络的参数,使得全卷积神经网络模型可以适用于限制内存的移动设备中,并且每个输出样本仅仅依赖相邻输入,可以通过更少的权重值很好地保留语音信
基于掩蔽效应的复卷积循环神经网络单通道语音增强方法.pdf
本发明公开了一种基于掩蔽效应的复卷积循环神经网络单通道语音增强方法,包括:参照Bark带的频率划分方法将傅里叶变换后的初始向量的频率维划分成最接近临界频带的相邻子向量间具有重叠的22个子向量,22个子向量代表22个子频带,送入相对应的22个并行复卷积循环网络子带模型中;在并连的子带模型之后串连两个全频带复全连接层,得到完整的基于掩蔽效应的复卷积循环神经网络模型;采用复理想比率掩码cIRM作为训练目标,将cIRM与原始待增强语音一起重构干净语音。本发明既能捕捉子频带内的局部频谱模式,又能捕捉全频带的频谱模式
基于注意力机制和卷积神经网络的语音抑郁症识别方法.pdf
本发明涉及一种基于注意力机制和卷积神经网络的语音抑郁症识别方法。本发明首先对语音数据进行预处理,对较长的语音数据进行分割,依据的是分割后的片段能够充分包含抑郁症相关的特征。然后对分割后每个片段提取梅尔频谱图,调整其输入到神经网络模型的频谱图尺寸大小,以便模型的训练。之后用预训练好的Alexnet深度卷积神经网络进行权值的微调,提取梅尔频谱图中更高级的语音特征。然后用注意力机制算法,对片段级语音特征进行权重调整,得到句级的语音特征。最后对句级语音特征用SVM分类模型进行抑郁症的分类。本发明方法考虑了和抑郁症