预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114242098A(43)申请公布日2022.03.25(21)申请号202111521637.1(22)申请日2021.12.13(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人李光正张国昌于利标魏建强(74)专利代理机构北京品源专利代理有限公司11332代理人赵翠香(51)Int.Cl.G10L21/0208(2013.01)G10L21/0216(2013.01)G10L21/0264(2013.01)G10L21/0232(2013.01)G10L25/30(2013.01)权利要求书2页说明书12页附图10页(54)发明名称一种语音增强方法、装置、设备以及存储介质(57)摘要本公开提供了一种语音增强方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习技术和语音技术领域,可用于音频通讯场景。具体实现方案为:对至少两路目标语音进行子带分解处理,得到至少两路目标语音的幅度谱和相位谱;其中,至少两路目标语音包括:目标混合语音和目标干扰语音;根据至少两路目标语音的幅度谱,确定目标混合语音在特征域内存在目标纯净语音的预测概率;根据预测概率、至少两路目标语音的幅度谱和相位谱,进行子带合成处理,得到目标混合语音中的目标纯净语音。能够提高语音增强效果,为语音增强提供了新的解决思路。CN114242098ACN114242098A权利要求书1/2页1.一种语音增强方法,包括:对至少两路目标语音进行子带分解处理,得到所述至少两路目标语音的幅度谱和相位谱;其中,所述至少两路目标语音包括:目标混合语音和目标干扰语音;根据所述至少两路目标语音的幅度谱,确定所述目标混合语音在特征域内存在目标纯净语音的预测概率;根据所述预测概率、所述至少两路目标语音的幅度谱和相位谱,进行子带合成处理,得到所述目标混合语音中的目标纯净语音。2.根据权利要求1所述的方法,其中,所述对至少两路目标语音进行子带分解处理,得到所述至少两路目标语音的幅度谱和相位谱,包括:对至少两路目标语音进行子带分解处理,得到所述至少两路目标语音的虚数信号;根据所述至少两路目标语音的虚数信号,确定所述至少两路目标语音的幅度谱和相位谱。3.根据权利要求1或2所述的方法,还包括:基于对数处理和/或归一化处理,更新所述至少两路目标语音的幅度谱。4.根据权利要求1所述的方法,其中,所述根据所述至少两路目标语音的幅度谱,确定所述目标混合语音在特征域内存在目标纯净语音的预测概率,包括:将所述至少两路目标语音的幅度谱输入到语音增强模型中,得到所述目标混合语音在特征域内存在目标纯净语音的预测概率;其中,所述语音增强模型包括:卷积神经网络、时间卷积网络、全连接网络和激活网络。5.根据权利要求4所述的方法,其中,所述语音增强模型是基于训练样本通过有监督训练得到,所述训练样本包括:基于麦克风指向性生成的样本纯净语音、样本干扰语音,以及对所述样本纯净语音混入不同类型噪声和/或回声的样本混合语音。6.根据权利要求1所述的方法,其中,所述根据所述预测概率、所述至少两路目标语音的幅度谱和相位谱,进行子带合成处理,得到所述目标混合语音中的目标纯净语音,包括:根据所述预测概率和所述目标混合语音的幅度谱,确定目标纯净语音的幅度谱;对所述目标纯净语音的幅度谱和所述目标混合语音的相位谱进行子带合成处理,得到目标纯净语音。7.根据权利要求1所述的方法,其中,所述至少两路目标语音还包括:初步对所述目标混合语音进行回声和/或噪声消除后的预处理语音;根据所述预测概率、所述至少两路目标语音的幅度谱和相位谱,进行子带合成处理,得到所述目标混合语音中的目标纯净语音,包括:根据所述预测概率、所述预处理语音的幅度谱和相位谱,进行子带合成处理,得到所述目标混合语音中的目标纯净语音。8.一种语音增强装置,包括:子带分解模块,用于对至少两路目标语音进行子带分解处理,得到所述至少两路目标语音的幅度谱和相位谱;其中,所述至少两路目标语音包括:目标混合语音和目标干扰语音;概率预测模块,用于根据所述至少两路目标语音的幅度谱,确定所述目标混合语音在特征域内存在目标纯净语音的预测概率;2CN114242098A权利要求书2/2页子带合成模块,用于根据所述预测概率、所述至少两路目标语音的幅度谱和相位谱,进行子带合成处理,得到所述目标混合语音中的目标纯净语音。9.根据权利要求8所述的装置,其中,所述子带分解模块,包括:子带分解单元,用于对至少两路目标语音进行子带分解处理,得到所述至少两路目标语音的虚数信号;频谱确定单元,用于根据所述至少两路目标语音的虚数信号,确定所述至少两路目标语音的幅度谱和相位谱。10.根据权利要求