语音数据的处理方法、装置、设备、介质和系统-豆柴文库

语音数据的处理方法、装置、设备、介质和系统.pdf

2023-11-15

10金币

796KB

21页

霞英****娘子

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共21页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109994122A(43)申请公布日2019.07.09(21)申请号201711488055.1G10L25/84(2013.01)(22)申请日2017.12.29(71)申请人阿里巴巴集团控股有限公司地址开曼群岛大开曼岛(72)发明人余涛田彪刘礼许敏强曹晶皓陈一宁薛彬(74)专利代理机构北京东方亿思知识产权代理有限责任公司11258代理人彭琼(51)Int.Cl.G10L21/0208(2013.01)G10L21/0216(2013.01)G10L21/0224(2013.01)G10L25/27(2013.01)G10L25/78(2013.01)权利要求书3页说明书12页附图5页(54)发明名称语音数据的处理方法、装置、设备、介质和系统(57)摘要本申请实施例公开了一种语音数据的处理方法、装置、设备、介质和系统，用以在去除串扰音的同时，增强可扩展性，降低升级难度。所述方法包括：在时域对齐处理后的多路语音数据中，确定每路语音数据与其它路语音数据之间的相关性、每路语音数据的信噪比；根据每路语音数据与其它路语音数据之间的相关性和/或每路语音数据的信噪比，确定每路语音数据的类型，其中，语音数据的类型包括主音和串扰音；保留类型为主音的语音数据，去除类型为串扰音的语音数据。CN109994122ACN109994122A权利要求书1/3页1.一种语音数据的处理方法，其特征在于，所述方法包括：在时域对齐处理后的多路语音数据中，确定每路语音数据与其它路语音数据之间的相关性、每路语音数据的信噪比；根据每路语音数据与其它路语音数据之间的相关性和/或每路语音数据的信噪比，确定每路语音数据的类型，其中，语音数据的类型包括主音和串扰音；保留类型为主音的语音数据，去除类型为串扰音的语音数据。2.根据权利要求1所述的方法，其特征在于，所述根据每路语音数据与其它路语音数据之间的相关性和/或每路语音数据的信噪比，确定每路语音数据的类型，包括：针对每路待确定语音数据：若所述待确定语音数据的信噪比与目标信噪比的比值大于或等于预设比例阈值，确定所述待确定语音数据的类型为主音；若所述待确定语音数据的信噪比与目标信噪比的比值小于所述预设比例阈值，且所述待确定语音数据的信噪比小于预设信噪比阈值，确定所述待确定语音数据的类型为串扰音；若所述待确定语音数据的信噪比与目标信噪比的比值小于所述预设比例阈值，且所述待确定语音数据的信噪比大于或等于所述预设信噪比阈值，则基于所述待确定语音数据与所述多路语音数据中其它路语音数据之间的相关性，确定所述待确定语音数据的类型；其中，所述目标信噪比为所述多路语音数据信噪比中的最大值。3.根据权利要求2所述的方法，其特征在于，所述基于所述待确定语音数据与所述多路语音数据中其它路语音数据之间的相关性，确定所述待确定语音数据的类型，包括：基于所述待确定语音数据与已确定为主音的所述其它路语音数据之间的相关性，确定所述待确定语音数据的类型。4.根据权利要求3所述的方法，其特征在于，所述基于所述待确定语音数据与已确定为主音的所述其它路语音数据之间的相关性，确定所述待确定语音数据的类型，包括：若所述待确定语音数据与已确定为主音的所述其它路语音数据之间的相关性大于或等于预设相关性阈值，确定所述待确定语音数据的类型为串扰音；若所述待确定语音数据与已确定为主音的所述其它路语音数据之间的相关性小于所述预设相关性阈值，确定所述待确定语音数据的类型为主音。5.根据权利要求1所述的方法，其特征在于，所述根据每路语音数据与其它路语音数据之间的相关性和/或每路语音数据的信噪比，确定每路语音数据的类型，包括：根据每路语音数据与其它路语音数据之间的相关性，将所述多路语音数据划分为第一类语音数据和第二类语音数据，其中，所述第一类语音数据中，每路语音数据与其它至少一语音数据之间的相关性大于或等于预设相关性阈值，所述第二类语音数据中包括所述多路语音数据中除第一类语音数据之外的其它路语音数据；针对所述第一类语音数据中的每路待确定语音数据，若所述待确定语音数据的信噪比与目标信噪比的比值大于或等于预设比例阈值，则确定所述待确定语音数据的类型为主音；若所述待确定语音数据的信噪比与目标信噪比的比值小于预设比例阈值，则确定所述待确定语音数据的类型为串扰音，其中，所述目标信噪比为所述多路语音数据信噪比中的最大值；2CN109994122A权利要求书2/3页针对所述第二类语音数据中的每路待确定语音数据，若所述待确定语音数据的信噪比大于或等于预设信噪比阈值，则确定所述待确定语音数据的类型为主音，若所述待确定语音数据的信噪比小于预设信噪比阈值，则确定所述待确定语音数据的类型为串扰音。6.根据权利要求1所述的方法，其

相关资料

语音数据的处理方法、装置、设备、介质和系统.pdf

本申请实施例公开了一种语音数据的处理方法、装置、设备、介质和系统，用以在去除串扰音的同时，增强可扩展性，降低升级难度。所述方法包括：在时域对齐处理后的多路语音数据中，确定每路语音数据与其它路语音数据之间的相关性、每路语音数据的信噪比；根据每路语音数据与其它路语音数据之间的相关性和/或每路语音数据的信噪比，确定每路语音数据的类型，其中，语音数据的类型包括主音和串扰音；保留类型为主音的语音数据，去除类型为串扰音的语音数据。

2023-11-15

796KB

处理语音数据的方法、处理语音数据的装置及存储介质.pdf

本公开是关于处理语音数据的方法，方法包括：获取语料库，其中语料库包括多个回复语段，其中每个回复语段设置有第一删除值；获取当前的对话请求，其中当前的对话请求基于上一轮的回复语段生成；通过情绪识别模型确定当前的对话请求的情绪置信值；若当前的对话请求的情绪置信值大于上一轮的回复语段的第一删除值，则将上一轮的回复语段的第一删除值更新为当前的对话请求的情绪置信值，得到第二删除值；基于当前的对话请求以及所述第二删除值，选取语料库中的一个回复语段作为当前的对话请求的回复语段。可以实时反馈人机对话质量，对人机交互中的回复

2023-08-26

954KB

语音数据处理方法、装置、设备及存储介质.pdf

本申请实施例公开了一种语音数据处理方法、装置、设备及存储介质，涉及人工智能中的机器学习技术，其中，方法包括：获取与第一网络状态关联的第一目标冗余参数，以及该第一目标冗余参数的长期奖励值，根据该第一目标冗余参数对待传输的第一原始语音数据进行冗余编码，得到第二语音数据包，通过该目标网络将该第二语音数据包发送至该接收设备；获取该接收设备对该第二语音数据包进行解析得到的该目标网络的第二网络状态，以及对该第二语音数据包中的异常数据进行恢复处理所生成的恢复状态信息；根据该第二网络状态、该恢复状态信息对该第一目标冗余参

2023-07-25

847KB

语音处理方法、介质、装置和计算设备.pdf

本发明的实施方式提供了一种语音处理方法、介质、装置和计算设备。该语音处理方法包括：获取指定人员的第一录音文件；从所述第一录音文件中提取所述指定人员的声纹特征；根据所述声纹特征，从第二录音文件中查找与所述声纹特征相匹配的录音数据；对所述录音数据进行转换处理，得到语音与文本的对应关系；基于所述语音与文本的对应关系，进行语音合成。本发明实施例的技术方案可以在得到较为全面的语料数据的基础上，提高语料数据的获取效率，同时增强获取语料数据的可扩展性。

2023-12-05

737KB

语音处理方法、介质、装置和计算设备.pdf

本发明的实施方式提供了一种语音处理方法、介质、装置和计算设备。该语音处理方法包括：获取待处理的录音文件；从所述录音文件中提取指定人员的声纹特征，得到第一声纹特征；根据所述第一声纹特征，从录音库中查找与所述第一声纹特征相匹配的目标录音数据；从所述目标录音数据中提取第二声纹特征；基于所述第二声纹特征确定所述录音文件中包含的所述指定人员的声音数据。本发明实施方式的技术方案可以在保证声纹特征准确率的前提下，提高声纹特征的提取效率，同时当需要更换人员时本发明实施方式的技术方案也能够快速提取到该人员的声纹特征，可扩展

2023-12-05

916KB