预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115019815A(43)申请公布日2022.09.06(21)申请号202210628053.2(22)申请日2022.06.06(71)申请人中国工商银行股份有限公司地址100140北京市西城区复兴门内大街55号(72)发明人赵玉迪陈永录王静仇国龙(74)专利代理机构华进联合专利商标代理有限公司44224专利代理师袁武(51)Int.Cl.G10L21/02(2013.01)G10L21/0208(2013.01)G10L25/30(2013.01)G10L17/06(2013.01)权利要求书2页说明书12页附图5页(54)发明名称语音增强方法、装置、设备、存储介质和程序产品(57)摘要本申请涉及一种语音增强方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取目标语音数据并确定语音增强模型,语音增强模型包括第一增强模型和第二增强模型;将目标语音数据输入至第一增强模型,得到第一增强模型输出的说话者信息;根据目标语音数据、说话者信息以及第二增强模型,获取目标语音数据对应的增强语音数据。采用本方法能够提高语音质量。CN115019815ACN115019815A权利要求书1/2页1.一种语音增强方法,其特征在于,所述方法包括:获取目标语音数据并确定语音增强模型,所述语音增强模型包括第一增强模型和第二增强模型;将所述目标语音数据输入至所述第一增强模型,得到所述第一增强模型输出的说话者信息;根据所述目标语音数据、所述说话者信息以及所述第二增强模型,获取所述目标语音数据对应的增强语音数据。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标语音数据、所述说话者信息以及所述第二增强模型,获取所述目标语音数据对应的增强语音数据,包括:将所述目标语音数据以及所述说话者信息输入至所述第二增强模型,得到所述第二增强模型输出的所述增强语音数据。3.根据权利要求1所述的方法,其特征在于,所述第二增强模型包括第一子模型和第二子模型,所述根据所述目标语音数据、所述说话者信息以及所述第二增强模型,获取所述目标语音数据对应的增强语音数据,包括:将所述目标语音数据输入至所述第一子模型,得到所述第一子模型输出的中间增强语音数据;将所述中间增强语音数据、所述目标语音数据以及所述说话者信息输入至所述第二子模型,得到所述第二子模型输出的所述增强语音数据。4.根据权利要求3所述的方法,其特征在于,所述第一增强模型、所述第一子模型和所述第二子模型均为DNN模型,所述DNN模型包括激活函数以及损失函数;所述激活函数为归一化指数函数,所述损失函数为分类交叉熵损失函数。5.根据权利要求1所述的方法,其特征在于,所述获取目标语音数据,包括:获取目标语音片段;对所述目标语音片段进行快速傅里叶变换处理,得到所述目标语音数据。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:对所述增强语音数据进行快速傅里叶逆变换处理,得到所述目标语音片段对应的目标增强语音片段。7.根据权利要求1至5任一项所述的方法,其特征在于,所述语音增强模型的训练过程,包括:获取训练样本集,所述训练样本集包括样本语音数据、所述样本语音数据对应的样本说话者信息以及所述样本语音数据对应的样本增强语音数据;基于所述样本语音数据以及所述样本说话者信息,训练初始第一增强模型,得到所述第一增强模型;基于所述样本语音数据、所述样本增强语音数据以及所述初始第一增强模型在训练过程中输出的说话者信息,训练初始第二增强模型,得到所述第二增强模型。8.一种语音增强装置,其特征在于,所述装置包括:获取模块,用于获取目标语音数据并确定语音增强模型,所述语音增强模型包括第一增强模型和第二增强模型;输出模块,用于将所述目标语音数据输入至所述第一增强模型,得到所述第一增强模2CN115019815A权利要求书2/2页型输出的说话者信息;生成模块,用于根据所述目标语音数据、所述说话者信息以及所述第二增强模型,获取所述目标语音数据对应的增强语音数据。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。3CN115019815A说明书1/12页语音增强方法、装置、设备、存储介质和程序产品技术领域[0001]本申请涉及人工智能技术领域,特别是涉及一种语音增强方法、装置、设备、存储介质和程序产品。背景技