预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108364654A(43)申请公布日2018.08.03(21)申请号201810087661.0G10L15/26(2006.01)(22)申请日2018.01.30G10L25/30(2013.01)(71)申请人网易乐得科技有限公司地址100193北京市海淀区西北旺东路10号院中关村软件园二期西区7号楼B座5层(72)发明人臧阳光沙泓州(74)专利代理机构北京律智知识产权代理有限公司11438代理人阚梓瑄王卫忠(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)G10L17/08(2013.01)G10L17/20(2013.01)权利要求书2页说明书13页附图5页(54)发明名称语音处理方法、介质、装置和计算设备(57)摘要本发明的实施方式提供了一种语音处理方法、介质、装置和计算设备。该语音处理方法包括:获取待处理的录音文件;从所述录音文件中提取指定人员的声纹特征,得到第一声纹特征;根据所述第一声纹特征,从录音库中查找与所述第一声纹特征相匹配的目标录音数据;从所述目标录音数据中提取第二声纹特征;基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。本发明实施方式的技术方案可以在保证声纹特征准确率的前提下,提高声纹特征的提取效率,同时当需要更换人员时本发明实施方式的技术方案也能够快速提取到该人员的声纹特征,可扩展性较强。CN108364654ACN108364654A权利要求书1/2页1.一种语音处理方法,包括:获取待处理的录音文件;从所述录音文件中提取指定人员的声纹特征,得到第一声纹特征;根据所述第一声纹特征,从录音库中查找与所述第一声纹特征相匹配的目标录音数据;从所述目标录音数据中提取第二声纹特征;基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。2.根据权利要求1所述的方法,其中,从所述录音文件中提取指定人员的声纹特征,包括:截取所述录音文件中预定时间段的录音数据;从所述预定时间段的录音数据中提出所述指定人员的声纹特征。3.根据权利要求2所述的方法,其中,截取所述录音文件中预定时间段的录音数据,包括:删除所述录音文件中位于最前端的指定类型的录音数据,得到预处理后的录音文件;在所述预处理后的录音文件的最前端截取所述预定时间段的录音数据。4.根据权利要求3所述的方法,其中,所述指定类型的录音数据包括静音数据和/或铃声数据。5.根据权利要求2所述的方法,其中,从所述预定时间段的录音数据中提出所述指定人员的声纹特征,包括:通过所述预定时间段的录音数据对通用背景模型进行训练;基于训练后的所述通用背景模型的参数,通过自适应高斯混合模型输出所述指定人员的声纹特征。6.根据权利要求1所述的方法,其中,根据所述第一声纹特征,从录音库中查找与所述第一声纹特征相匹配的目标录音数据,包括:将所述录音库中的录音数据切分为多个预定长度的测试录音;计算所述测试录音的声纹特征与所述第一声纹特征的相似度;选取相似度大于第一预定阈值的预定数量个测试录音,并根据选取出的测试录音生成所述目标录音数据。7.根据权利要求6所述的方法,其中,根据选取出的测试录音生成所述目标录音数据,包括:对选取出的测试录音进行拼接处理,以得到所述目标录音数据。8.一种介质,其上存储有程序,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。9.一种语音处理装置,包括:获取单元,用于获取待处理的录音文件;第一提取单元,用于从所述录音文件中提取指定人员的声纹特征,得到第一声纹特征;第一查找单元,用于根据所述第一声纹特征,从录音库中查找与所述第一声纹特征相匹配的目标录音数据;第二提取单元,用于从所述目标录音数据中提取第二声纹特征;2CN108364654A权利要求书2/2页确定单元,用于基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。10.一种计算设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。3CN108364654A说明书1/13页语音处理方法、介质、装置和计算设备技术领域[0001]本发明的实施方式涉及通信及计算机技术领域,更具体地,本发明的实施方式涉及语音处理方法、介质、装置和计算设备。背景技术[0002]本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。[0003]在智能客服场景中,通常需要使用对话语音转写技术来将客服与客户的语音对话转换成文字内容,以便后续的质量分析和质量监督。[0004]其中,在从客服与客户的对话中提取客服的语音时,需要依