语音处理方法、介质、装置和计算设备-豆柴文库

语音处理方法、介质、装置和计算设备.pdf

2023-12-05

10金币

916KB

21页

一只****爱敏

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共21页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108364654A(43)申请公布日2018.08.03(21)申请号201810087661.0G10L15/26(2006.01)(22)申请日2018.01.30G10L25/30(2013.01)(71)申请人网易乐得科技有限公司地址100193北京市海淀区西北旺东路10号院中关村软件园二期西区7号楼B座5层(72)发明人臧阳光沙泓州(74)专利代理机构北京律智知识产权代理有限公司11438代理人阚梓瑄王卫忠(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)G10L17/08(2013.01)G10L17/20(2013.01)权利要求书2页说明书13页附图5页(54)发明名称语音处理方法、介质、装置和计算设备(57)摘要本发明的实施方式提供了一种语音处理方法、介质、装置和计算设备。该语音处理方法包括：获取待处理的录音文件；从所述录音文件中提取指定人员的声纹特征，得到第一声纹特征；根据所述第一声纹特征，从录音库中查找与所述第一声纹特征相匹配的目标录音数据；从所述目标录音数据中提取第二声纹特征；基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。本发明实施方式的技术方案可以在保证声纹特征准确率的前提下，提高声纹特征的提取效率，同时当需要更换人员时本发明实施方式的技术方案也能够快速提取到该人员的声纹特征，可扩展性较强。CN108364654ACN108364654A权利要求书1/2页1.一种语音处理方法，包括：获取待处理的录音文件；从所述录音文件中提取指定人员的声纹特征，得到第一声纹特征；根据所述第一声纹特征，从录音库中查找与所述第一声纹特征相匹配的目标录音数据；从所述目标录音数据中提取第二声纹特征；基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。2.根据权利要求1所述的方法，其中，从所述录音文件中提取指定人员的声纹特征，包括：截取所述录音文件中预定时间段的录音数据；从所述预定时间段的录音数据中提出所述指定人员的声纹特征。3.根据权利要求2所述的方法，其中，截取所述录音文件中预定时间段的录音数据，包括：删除所述录音文件中位于最前端的指定类型的录音数据，得到预处理后的录音文件；在所述预处理后的录音文件的最前端截取所述预定时间段的录音数据。4.根据权利要求3所述的方法，其中，所述指定类型的录音数据包括静音数据和/或铃声数据。5.根据权利要求2所述的方法，其中，从所述预定时间段的录音数据中提出所述指定人员的声纹特征，包括：通过所述预定时间段的录音数据对通用背景模型进行训练；基于训练后的所述通用背景模型的参数，通过自适应高斯混合模型输出所述指定人员的声纹特征。6.根据权利要求1所述的方法，其中，根据所述第一声纹特征，从录音库中查找与所述第一声纹特征相匹配的目标录音数据，包括：将所述录音库中的录音数据切分为多个预定长度的测试录音；计算所述测试录音的声纹特征与所述第一声纹特征的相似度；选取相似度大于第一预定阈值的预定数量个测试录音，并根据选取出的测试录音生成所述目标录音数据。7.根据权利要求6所述的方法，其中，根据选取出的测试录音生成所述目标录音数据，包括：对选取出的测试录音进行拼接处理，以得到所述目标录音数据。8.一种介质，其上存储有程序，该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。9.一种语音处理装置，包括：获取单元，用于获取待处理的录音文件；第一提取单元，用于从所述录音文件中提取指定人员的声纹特征，得到第一声纹特征；第一查找单元，用于根据所述第一声纹特征，从录音库中查找与所述第一声纹特征相匹配的目标录音数据；第二提取单元，用于从所述目标录音数据中提取第二声纹特征；2CN108364654A权利要求书2/2页确定单元，用于基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。10.一种计算设备，包括：处理器和存储器，所述存储器存储有可执行指令，所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。3CN108364654A说明书1/13页语音处理方法、介质、装置和计算设备技术领域[0001]本发明的实施方式涉及通信及计算机技术领域，更具体地，本发明的实施方式涉及语音处理方法、介质、装置和计算设备。背景技术[0002]本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。[0003]在智能客服场景中，通常需要使用对话语音转写技术来将客服与客户的语音对话转换成文字内容，以便后续的质量分析和质量监督。[0004]其中，在从客服与客户的对话中提取客服的语音时，需要依

相关资料

语音处理方法、介质、装置和计算设备.pdf

本发明的实施方式提供了一种语音处理方法、介质、装置和计算设备。该语音处理方法包括：获取指定人员的第一录音文件；从所述第一录音文件中提取所述指定人员的声纹特征；根据所述声纹特征，从第二录音文件中查找与所述声纹特征相匹配的录音数据；对所述录音数据进行转换处理，得到语音与文本的对应关系；基于所述语音与文本的对应关系，进行语音合成。本发明实施例的技术方案可以在得到较为全面的语料数据的基础上，提高语料数据的获取效率，同时增强获取语料数据的可扩展性。

2023-12-05

737KB

语音处理方法、介质、装置和计算设备.pdf

本发明的实施方式提供了一种语音处理方法、介质、装置和计算设备。该语音处理方法包括：获取待处理的录音文件；从所述录音文件中提取指定人员的声纹特征，得到第一声纹特征；根据所述第一声纹特征，从录音库中查找与所述第一声纹特征相匹配的目标录音数据；从所述目标录音数据中提取第二声纹特征；基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。本发明实施方式的技术方案可以在保证声纹特征准确率的前提下，提高声纹特征的提取效率，同时当需要更换人员时本发明实施方式的技术方案也能够快速提取到该人员的声纹特征，可扩展

2023-12-05

916KB

语音处理方法、装置、计算机设备和存储介质.pdf

本申请涉及一种语音处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取源说话者的源语音；对所述源语音进行语音识别，得到待转换语言文本；提取所述待转换语言文本对应的第一文本特征；基于所述第一文本特征确定所述待转换语言文本的源语言种类；根据所述源语言种类以及预设的目标语言种类对所述待转换语言文本进行翻译，得到目标语言文本；根据所述目标语言文本生成目标说话者的目标语音。采用本方法能够在源说话者和目标说话者使用的语言种类不同时，也可以将源说话者的语音转化为目标说话者的语音。

2023-07-24

1.1MB

语音交互方法、介质、装置和计算设备.pdf

本发明的实施方式提供了一种语音交互方法，包括：接收用户输入的语音信息，将所述语音信息转换为语句文本；从预置音乐评论库中获取与所述语句文本相匹配的评论信息；以及输出所述评论信息作为对于所述语音信息的应答。本公开实施例充分利用已有的音乐评论信息作为应答，大量缩减在应答内容撰写上所投入的人力，且能够引起当前输入语音信息的用户的情感共鸣，满足用户情感需求。本发明的实施方式还提供了一种语音交互装置、介质和计算设备。

2023-12-04

870KB

语音处理方法、装置、电子设备和介质.pdf

本公开公开了一种语音处理方法、装置、设备、介质和产品，涉及语音技术领域。语音处理方法包括：从针对多个对象的第一语音数据中，确定针对多个对象中目标对象的至少一个语音片段；基于至少一个语音片段，确定目标对象的声纹特征；基于目标对象的声纹特征，处理第二语音数据，得到第二语音数据中针对目标对象的语音识别结果。

2023-07-25

663KB