预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113870891A(43)申请公布日2021.12.31(21)申请号202111130337.0(22)申请日2021.09.26(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人刘博卿王健宗张之勇(74)专利代理机构广州嘉权专利商标事务所有限公司44205代理人麦广林(51)Int.Cl.G10L21/0272(2013.01)权利要求书3页说明书12页附图5页(54)发明名称语音提取方法、系统、装置及存储介质(57)摘要本发明实施例公开了一种语音提取方法、系统、装置及存储介质,包括:获取目标说话人的特征向量及多通道混合语音的多通道特征向量;将特征向量及多通道特征向量输入到预设模型提取目标特征向量;根据目标特征向量及多通道特征向量确定目标语音信号;预设模型的训练方法包括:获取样本训练数据;将特征向量样本及多通道特征向量样本输入到特征提取模块得到第一特征向量;将第一特征向量及多通道特征向量样本输入到分离模块得到第二特征向量;根据特征向量样本与第二特征向量的目标函数计算的目标值更新特征提取模块和分离模块。本发明的技术方案,能够在无需寻找中间接入层的情况下,提高了语音提取分离的效果,可广泛应用于人工智能领域。CN113870891ACN113870891A权利要求书1/3页1.一种语音提取方法,其特征在于,包括:获取预先注册的目标说话人的特征向量及多通道混合语音的多通道特征向量;将所述预先注册的目标说话人的特征向量及所述多通道特征向量输入到预设模型提取目标说话人的目标特征向量;根据所述目标说话人的目标特征向量及所述多通道特征向量确定目标说话人的目标语音信号;其中,所述预设模型包括特征提取模块和分离模块,所述预设模型的训练方法包括:获取样本训练数据,所述样本训练数据包括单通道语音的特征向量样本、预先注册的特征向量样本和多通道混合语音的多通道特征向量样本;将所述预先注册的特征向量样本及所述多通道特征向量样本输入到所述特征提取模块得到第一特征向量;将所述第一特征向量及所述多通道特征向量样本输入到所述分离模块得到第二特征向量;根据所述单通道语音的特征向量样本与所述第二特征向量之间的优化目标函数计算优化目标值,根据所述优化目标值更新所述特征提取模块和所述分离模块。2.根据权利要求1所述的语音提取方法,其特征在于,所述多通道混合语音的多通道特征向量通过以下方法获取:获取多通道混合语音并将所述多通道混合语音分割成若干个预设长度的混合语音片段;依次将所述混合语音片段输入到空间编码器得到若干个混合特征向量;获取单通道混合语音并将所述单通道混合语音分割成若干个预设长度的单通道语音片段;依次将所述单通道语音片段输入到频谱编码器得到若干个单通道特征向量;将所述若干个混合特征向量及所述若干个单通道特征向量拼接生成所述多通道特征向量。3.根据权利要求1所述的语音提取方法,其特征在于,所述特征提取模块包括第一神经网络、第二神经网络及第三神经网络,将所述预先注册的特征向量样本及所述多通道特征向量样本输入到所述特征提取模块得到第一特征向量,包括:通过所述第一神经网络对所述预先注册的特征向量样本进行处理,获得N维第三特征向量;通过所述第二神经网络对所述多通道特征向量样本进行处理,获得N维第四特征向量;将所述N维第三特征向量及所述N维第四特征向量输入到所述第三神经网络进行处理,获得第一特征向量;其中,N为大于等于2的正整数。4.根据权利要求3所述的语音提取方法,其特征在于,所述第二神经网络包括第一实例正则层、第一卷积层、TCN层及第二卷积层,所述通过所述第二神经网络对所述多通道特征向量样本进行处理,获得N维第四特征向量,包括:将所述多通道特征向量样本输入至所述第一实例正则层得到第一处理向量;将所述第一处理向量输入至所述第一卷积层得到第二处理向量;2CN113870891A权利要求书2/3页将所述第二处理向量输入至所述TCN层得到所述第三处理向量;将所述第三处理向量输入至所述第二卷积层得到所述N维第四特征向量。5.根据权利要求1所述的语音提取方法,其特征在于,所述分离模块包括第四神经网络,所述第四神经网络包括第二实例正则层、第三卷积层、TCN单元及第四卷积层,所述TCN单元包括若干个TCN层,所述将所述第一特征向量及所述多通道特征向量样本输入到所述分离模块得到第二特征向量,包括:将所述第一特征向量及所述多通道特征向量样本输入到所述第二实例正则层得到第四处理向量;将所述第四处理向量输入到所述第三卷积层得到第五处理向量;将所述第五处理向量输入到所述TCN单元得到第六处理向量;将所述第六处理向量输入到所述第四卷