预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113823272A(43)申请公布日2021.12.21(21)申请号202110615155.6(22)申请日2021.06.02(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人曹松军康跃腾付彦喆徐晓烁孙思宁张一珂马龙(74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙)44300代理人李汉亮(51)Int.Cl.G10L15/06(2013.01)权利要求书2页说明书18页附图3页(54)发明名称语音处理方法、装置、电子设备以及存储介质(57)摘要本申请公开了一种语音处理方法、装置、电子设备以及存储介质,包括:获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型;根据第一语音样本对流式语音处理模型进行调整,得到调整后流式语音处理模型;基于第一语音样本、第二语音样本以及流式语音处理模型对应的教师模型,对流式语音处理模型进行训练,得到训练后流式语音处理模型;根据第一语音样本、基础语音模型以及语言模型对第二语音样本进行标注,得到标注后第二语音样本;基于第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行训练,得到目标语音处理模型,以通过目标语音处理模型对待处理语音进行处理。CN113823272ACN113823272A权利要求书1/2页1.一种语音处理方法,其特征在于,包括:获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型,所述基础语音模型包括非流式变换器,所述流式语音处理模型为将所述基础语音模型中的非流式变换器替换为流式变换器得到的;根据所述第一语音样本对所述流式语音处理模型进行调整,得到调整后流式语音处理模型;基于所述第一语音样本、第二语音样本以及所述流式语音处理模型对应的教师模型,对所述流式语音处理模型进行训练,得到训练后流式语音处理模型;根据所述第一语音样本、基础语音模型以及语言模型对所述第二语音样本进行标注,得到标注后第二语音样本;基于所述第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行训练,得到目标语音处理模型,以通过所述目标语音处理模型对待处理语音进行处理。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一语音样本、第二语音样本以及所述流式语音处理模型对应的教师模型,对所述流式语音处理模型进行训练,得到训练后流式语音处理模型,包括:获取所述流式语音处理模型对应的教师模型;确定所述教师模型中网络层与所述流式语音处理模型中网络层之间的对应关系;基于所述对应关系、第一语音样本以及第二语音样本对所述流式语音处理模型进行训练,得到训练后流式语音处理模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述对应关系、第一语音样本以及第二语音样本对所述流式语音处理模型进行训练,得到训练后流式语音处理模型,包括:根据所述对应关系以及所述教师模型中网络层的网络参数,对所述流式语音处理模型进行初始化;基于所述第一语音样本以及第二语音样本对初始化的流式语音处理模型进行训练,得到训练后流式语音处理模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一语音样本以及第二语音样本对初始化的流式语音处理模型进行训练,得到训练后流式语音处理模型,包括:将所述第一语音样本以及第二语音样本输入至教师模型中,以及;将所述第一语音样本以及第二语音样本输入至初始化的流式语音处理模型中;基于所述教师模型的输出以及初始化的流式语音处理模型的输出,计算所述教师模型与初始化的流式语音处理模型之间的蒸馏损失、以及所述初始化的流式语音处理模型的模型损失;根据所述蒸馏损失与模型损失对初始化的流式语音处理模型进行训练,得到训练后流式语音处理模型。5.根据权利要求2所述的方法,其特征在于,所述确定所述教师模型中网络层与所述流式语音处理模型中网络层之间的对应关系,包括:提取所述教师模型中网络层对应的权重信息,得到第一权重信息,以及;提取所述流式语音处理模型中网络层对应的权重信息,得到第二权重信息;基于所述第一权重信息与第二权重信息之间的相似度,确定所述教师模型中网络层与2CN113823272A权利要求书2/2页所述流式语音处理模型中网络层之间的对应关系。6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述第一语音样本对所述流式语音处理模型进行调整,得到调整后流式语音处理模型,包括:获取预设时序分类算法;基于所述时序分类算法以及第一语音样本的标签对所述流式语音处理模型进行调整,得到调整后流式语音处理模型。7.根据权利要求6所述的方法,其特征在于,所述基于所述时序分类算法以及第一语音样本