预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108364655A(43)申请公布日2018.08.03(21)申请号201810098244.6G10L13/08(2013.01)(22)申请日2018.01.31(71)申请人网易乐得科技有限公司地址100193北京市海淀区西北旺东路10号院中关村软件园二期西区7号楼B座5层(72)发明人沙泓州臧阳光林月冠王波宋婷张锦锋(74)专利代理机构北京律智知识产权代理有限公司11438代理人阚梓瑄王卫忠(51)Int.Cl.G10L17/02(2013.01)G10L15/08(2006.01)G10L15/26(2006.01)权利要求书2页说明书13页附图3页(54)发明名称语音处理方法、介质、装置和计算设备(57)摘要本发明的实施方式提供了一种语音处理方法、介质、装置和计算设备。该语音处理方法包括:获取指定人员的第一录音文件;从所述第一录音文件中提取所述指定人员的声纹特征;根据所述声纹特征,从第二录音文件中查找与所述声纹特征相匹配的录音数据;对所述录音数据进行转换处理,得到语音与文本的对应关系;基于所述语音与文本的对应关系,进行语音合成。本发明实施例的技术方案可以在得到较为全面的语料数据的基础上,提高语料数据的获取效率,同时增强获取语料数据的可扩展性。CN108364655ACN108364655A权利要求书1/2页1.一种语音处理方法,包括:获取指定人员的第一录音文件;从所述第一录音文件中提取所述指定人员的声纹特征;根据所述声纹特征,从第二录音文件中查找与所述声纹特征相匹配的录音数据;对所述录音数据进行转换处理,得到语音与文本的对应关系;基于所述语音与文本的对应关系,进行语音合成。2.根据权利要求1所述的方法,其中,对所述录音数据进行转换处理,得到语音与文本的对应关系,包括:确定所述录音数据中各段录音对应的至少一个候选词组,以及所述至少一个候选词组的选择概率;根据所述至少一个候选词组的选择概率,确定所述各段录音对应的文本,以得到语音与文本的对应关系。3.根据权利要求2所述的方法,其中,确定所述录音数据中各段录音对应的至少一个候选词组,以及所述至少一个候选词组的选择概率,包括:将所述各段录音转换为音素;根据所述各段录音转换得到的音素,确定所述录音数据中各段录音对应的至少一个候选词组,以及所述至少一个候选词组的选择概率。4.根据权利要求3所述的方法,其中,将所述各段录音转换为音素,包括:构建语音与音素的转换模型;基于所述语音与音素的转换模型将所述各段录音转换为音素。5.根据权利要求3所述的方法,其中,根据所述各段录音转换得到的音素,确定所述录音数据中各段录音对应的至少一个候选词组,以及所述至少一个候选词组的选择概率,包括:构建音素与词组的转换模型;根据所述音素与词组的转换模型及所述各段录音转换得到的音素,确定所述各段录音对应的至少一个候选词组,以及所述至少一个候选词组的选择概率。6.根据权利要求2所述的方法,其中,根据所述至少一个候选词组的选择概率,确定所述各段录音对应的文本,包括:计算所述各段录音对应的至少一个候选词组中选择概率最大的两个候选词组的选择概率之差;若任一段录音对应的所述两个候选词组的选择概率之差大于或等于预定值,则将所述两个候选词组中选择概率最大的候选词组作为所述任一段录音对应的文本。7.根据权利要求6所述的方法,还包括:若所述任一段录音对应的所述两个候选词组的选择概率之差小于所述预定值,则删除所述任一段录音及所述任一段录音对应的至少一个候选词组。8.一种介质,其上存储有程序,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。9.一种语音处理装置,包括:获取单元,用于获取指定人员的第一录音文件;2CN108364655A权利要求书2/2页提取单元,用于从所述第一录音文件中提取所述指定人员的声纹特征;查找单元,用于根据所述声纹特征,从第二录音文件中查找与所述声纹特征相匹配的录音数据;处理单元,用于对所述录音数据进行转换处理,得到语音与文本的对应关系;合成单元,用于基于所述语音与文本的对应关系,进行语音合成。10.一种计算设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。3CN108364655A说明书1/13页语音处理方法、介质、装置和计算设备技术领域[0001]本发明的实施方式涉及通信及计算机技术领域,更具体地,本发明的实施方式涉及语音处理方法、介质、装置和计算设备。背景技术[0002]本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。[0003]在智能客服场景中,通常需