预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112542177A(43)申请公布日2021.03.23(21)申请号202011215523.X(22)申请日2020.11.04(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人张国昌于利标韩润强魏建强(74)专利代理机构北京鸿德海业知识产权代理有限公司11412代理人谷春静(51)Int.Cl.G10L21/0208(2013.01)G10L25/30(2013.01)权利要求书3页说明书10页附图6页(54)发明名称信号增强方法、装置及存储介质(57)摘要本申请公开了信号增强方法、装置及存储介质,涉及深度学习及智能语音等人工智能领域,其中的方法可包括:对第一信号进行子带分解,得到第一子带信号,对第一信号对应的参考信号进行子带分解,得到第二子带信号;对第一子带信号进行线性声学回波消除,得到第三子带信号;将第三子带信号输入第一模型,根据第一模型的输出及第三子带信号生成初步去除混响后的第四子带信号;将第四子带信号及第二子带信号输入第二模型,根据第二模型的输出及第四子带信号生成去除噪声、残留回波及混响后的第五子带信号;根据第五子带信号生成增强后的第一信号。应用本申请所述方案,可降低实现复杂度并提升处理效果等。CN112542177ACN112542177A权利要求书1/3页1.一种信号增强方法,包括:对待处理的第一信号进行子带分解,得到第一子带信号,对所述第一信号对应的参考信号进行子带分解,得到第二子带信号;对所述第一子带信号进行线性声学回波消除,得到第三子带信号;将所述第三子带信号输入预先训练得到的第一模型,根据所述第一模型的输出及所述第三子带信号生成初步去除混响后的第四子带信号;将所述第四子带信号及所述第二子带信号输入预先训练得到的第二模型,根据所述第二模型的输出及所述第四子带信号生成去除噪声、残留回波及混响后的第五子带信号;根据所述第五子带信号生成增强后的第一信号。2.根据权利要求1所述的方法,其中,所述第一模型的输出包括:所述第三子带信号中的各子带分别对应的含噪直达声语音存在概率;所述根据所述第一模型的输出及所述第三子带信号生成初步去除混响后的第四子带信号包括:用所述第一模型的输出点乘所述第三子带信号中的幅度谱,得到所述第四子带信号。3.根据权利要求2所述的方法,其中,所述第一模型用于执行以下操作:对所述第三子带信号进行右移操作;将右移操作结果与所述第三子带信号进行拼接;对拼接结果中每个子带对应的部分分别执行第一预定处理,得到各子带对应的所述含噪直达声语音存在概率。4.根据权利要求3所述的方法,其中,所述第一预定处理包括:依次进行的复数卷积神经网络CNN、取绝对值后的对数运算log||、至少两层实数CNN、至少两层循环神经网络RNN、全连接及S型函数sigmoid处理。5.根据权利要求1所述的方法,其中,所述第二模型的输出包括:所述第三子带信号中的各子带分别对应的直达声语音存在概率;所述根据所述第二模型的输出及所述第四子带信号生成去除噪声、残留回波及混响后的第五子带信号包括:用所述第二模型的输出点乘所述第四子带信号中的幅度谱,得到所述第五子带信号。6.根据权利要求5所述的方法,其中,所述第二模型用于执行以下操作:利用第一复数卷积神经网络CNN对所述第四子带信号进行复数CNN处理,利用第二复数CNN对所述第二子带信号进行复数CNN处理;将所述第一复数CNN和所述第二复数CNN的输出进行拼接;根据所述拼接结果,通过第二预定处理生成所述第三子带信号中的各子带分别对应的所述直达声语音存在概率。7.根据权利要求6所述的方法,其中,所述第二预定处理包括:依次进行的最大池化Maxpooling、取绝对值后的对数运算log||、至少两层实数CNN、至少两层循环神经网络RNN、全连接及S型函数sigmoid处理。8.根据权利要求1所述的方法,还包括:分别独立训练所述第一模型和所述第二模型;当所述第一模型和所述第二模型均训练收敛后,对所述第一模型和所述第二模型进行2CN112542177A权利要求书2/3页联合微调。9.根据权利要求8所述的方法,还包括:在模型训练过程中,使用尺度不变信噪比作为损失函数。10.一种信号增强装置,包括:子带分解模块、线性处理模块、第一去除模块、第二去除模块以及信号生成模块;所述子带分解模块,用于对待处理的第一信号进行子带分解,得到第一子带信号,并对所述第一信号对应的参考信号进行子带分解,得到第二子带信号;所述线性处理模块,用于对所述第一子带信号进行线性声学回波消除,得到第三子带信号;所述第一去除模块,用于将所述第三子带信号输入预先训练得到的第一模型,根据所述第一模型的输出及所