一种基于注意力机制和卷积神经网络的单通道语音增强方法.pdf
葫芦****io
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种基于注意力机制和卷积神经网络的单通道语音增强方法.pdf
本发明公开了一种基于注意力机制和卷积神经网络的单通道语音增强方法,包括训练阶段和增强阶段:训练阶段:首先将噪声与纯净语音合成带噪语音,接着对带噪语音进行特征提取,然后将纯净语音与特征提取后的带噪语音一并送入神经网络模型中学习带噪语音和纯净语音之间的映射关系,训练阶段结束后,将训练好的模型保存下来;增强阶段:首先对带噪语音进行特征提取,然后送入训练好的模型中进行语音增强,最后输出增强后的语音。本发明的基于注意力机制和卷积神经网络的单通道语音增强方法可直接在时域上对带噪语音进行增强,不但可以节省傅里叶变换的计
基于掩蔽效应的复卷积循环神经网络单通道语音增强方法.pdf
本发明公开了一种基于掩蔽效应的复卷积循环神经网络单通道语音增强方法,包括:参照Bark带的频率划分方法将傅里叶变换后的初始向量的频率维划分成最接近临界频带的相邻子向量间具有重叠的22个子向量,22个子向量代表22个子频带,送入相对应的22个并行复卷积循环网络子带模型中;在并连的子带模型之后串连两个全频带复全连接层,得到完整的基于掩蔽效应的复卷积循环神经网络模型;采用复理想比率掩码cIRM作为训练目标,将cIRM与原始待增强语音一起重构干净语音。本发明既能捕捉子频带内的局部频谱模式,又能捕捉全频带的频谱模式
基于注意力的复数卷积神经网络语音增强方法及系统.pdf
本发明提供一种基于注意力的复数卷积神经网络语音增强方法及系统,其特征在于:针对带有背景噪音的语音进行降噪从而实现对语音的增强,包括使用通道时频注意力机制捕捉时频域的语音分布;使用门控时间卷积网络GTCN进行时间建模,从而减少网络的参数、提高网络的训练速度;使用亚像素卷积对实现对纯净语音的重构,避免反卷积时造成的棋盘伪影。本发明有效的提升了网络降噪效果,降低语音信号中的噪声影响,从而提高了语音的可懂度和质量。
基于注意力机制和卷积神经网络的语音抑郁症识别方法.pdf
本发明涉及一种基于注意力机制和卷积神经网络的语音抑郁症识别方法。本发明首先对语音数据进行预处理,对较长的语音数据进行分割,依据的是分割后的片段能够充分包含抑郁症相关的特征。然后对分割后每个片段提取梅尔频谱图,调整其输入到神经网络模型的频谱图尺寸大小,以便模型的训练。之后用预训练好的Alexnet深度卷积神经网络进行权值的微调,提取梅尔频谱图中更高级的语音特征。然后用注意力机制算法,对片段级语音特征进行权重调整,得到句级的语音特征。最后对句级语音特征用SVM分类模型进行抑郁症的分类。本发明方法考虑了和抑郁症
基于注意力机制的卷积神经网络入侵检测方法.pdf
本发明提供一种基于注意力机制的卷积神经网络入侵检测方法,在卷积神经网络的基础之上,结合了CBAM注意力机制。在全局特征提取过程中,入侵检测模型使用卷积来提取,但是传统的卷积在面对海量数据时,无法精准有效的提取特征。本专利采用Inception结构从多个维度进行特征提取。另外在卷积过程中可能会丢失重要信息,通过CBAM注意力机制进行维度更新,使其可以更好地捕捉全局特征与局部特征之间的关系,减少噪声的干扰,可以更好地检测出数据细节的变化。该方法不仅解决了数据存在的不平衡问题,而且提高了整体网络的特征表示能力。