一种语音增强方法、装置、设备及存储介质.pdf
一吃****昕靓
亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音增强方法、装置、设备及存储介质.pdf
本发明公开了一种语音增强方法、装置、设备及存储介质。获取语音样本数据,并将所述语音样本数据按照设定比例拆分为训练集和验证集;其中,所述语音样本数据包括带噪语音及对应的纯净语音;基于所述训练集对设定语音增强模型进行训练;基于所述验证集对训练后的所述设定语音增强模型进行验证;将待增强语音输入验证后的所述设定语音增强模型,输出目标语音。本发明实施例提供的语音增强方法,将待增强语音输入验证后的设定语音增强模型,输出目标语音,可以改善语音增强过程中容易产生语音丢失和语音失真等损伤原始语音数据的问题,保证语音增强的效
一种语音增强方法、装置、设备及存储介质.pdf
本发明实施例公开了一种语音增强方法、装置、设备及存储介质。该方法包括:将待处理的带噪语音信号输入到目标语音增强模型中;其中,所述目标语音增强模型包含编码网络、降噪网络和解码网络;通过所述编码网络,对所述带噪语音信号执行编码操作,得到输出的编码语音特征;将所述编码语音特征输入到所述降噪网络中,得到输出的降噪语音特征;基于所述编码语音特征、降噪语音特征和所述解码网络,确定与所述带噪语音信号对应的增强语音信号。本发明实施例通过直接将带噪语音信号输入到目标语音增强模型中,解决了频域语音增强方法需要时域变换的问题,
一种语音增强方法、装置、设备以及存储介质.pdf
本公开提供了一种语音增强方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习技术和语音技术领域,可用于音频通讯场景。具体实现方案为:对至少两路目标语音进行子带分解处理,得到至少两路目标语音的幅度谱和相位谱;其中,至少两路目标语音包括:目标混合语音和目标干扰语音;根据至少两路目标语音的幅度谱,确定目标混合语音在特征域内存在目标纯净语音的预测概率;根据预测概率、至少两路目标语音的幅度谱和相位谱,进行子带合成处理,得到目标混合语音中的目标纯净语音。能够提高语音增强效果,为语音增强提供了新的解决思
语音增强方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音增强方法、装置、设备、存储介质及程序产品,涉及语音技术处理领域。该方法包括:沿频域维度对待进行语音增强的目标音频进行频带切分,得到至少两个子频带;获取至少两个子频带分别对应的子带能量数据;沿时域维度对至少两个子频带分别对应的子带能量数据进行分析,得到至少两个子频带分别对应的子带能量分布数据;当指定子频带对应的子带能量分布数据符合调整条件的情况下,对指定子频带的子带能量数据进行调整,得到目标增强音频。通过以上方式,能够有选择地对目标音频中不符合调整条件的子带能量数据进行调整,在充分考虑目
语音增强方法、装置、设备、存储介质和程序产品.pdf
本申请涉及一种语音增强方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取目标语音数据并确定语音增强模型,语音增强模型包括第一增强模型和第二增强模型;将目标语音数据输入至第一增强模型,得到第一增强模型输出的说话者信息;根据目标语音数据、说话者信息以及第二增强模型,获取目标语音数据对应的增强语音数据。采用本方法能够提高语音质量。