语音处理方法、装置、系统及存储介质-豆柴文库

语音处理方法、装置、系统及存储介质.pdf

2023-11-13

10金币

637KB

15页

星菱****23

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共15页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111816191A(43)申请公布日2020.10.23(21)申请号202010666203.XG10L17/20(2013.01)(22)申请日2020.07.08(71)申请人珠海格力电器股份有限公司地址519070广东省珠海市前山金鸡西路申请人珠海联云科技有限公司(72)发明人李瑞贾巨涛张伟伟戴林胡广绪(74)专利代理机构北京华夏泰和知识产权代理有限公司11662代理人卢万腾王卫忠(51)Int.Cl.G10L17/22(2013.01)G10L17/02(2013.01)G10L17/04(2013.01)G10L17/06(2013.01)权利要求书2页说明书9页附图3页(54)发明名称语音处理方法、装置、系统及存储介质(57)摘要本发明实施例涉及一种语音处理方法、装置、系统及存储介质，所述方法包括：获取第一语音片段；从所述第一语音片段中提取人声部分，作为第二语音片段；确定所述第二语音片段对应的声纹特征；从声纹数据库中匹配出与所述声纹特征对应的人物信息，由此方法，可以实现根据语音留言对用户的身份进行识别，从而对留言进行准备分类，并存储到用户对应的语音数据库中，当其他用户获取留言时可按照指定身份提取目标留言，避免时间的浪费，提升客户体验度。CN111816191ACN111816191A权利要求书1/2页1.一种语音处理方法，其特征在于，包括：获取第一语音片段；从所述第一语音片段中提取人声部分，作为第二语音片段；确定所述第二语音片段对应的声纹特征；从声纹数据库中匹配出与所述声纹特征对应的人物信息。2.根据权利要求1所述的方法，其特征在于，所述从所述第一语音片段中提取人声部分，作为第二语音片段，包括：对所述第一语音片段进行去噪处理，得到去除噪声后的所述第一语音片段；对去除噪声后的所述第一语音片段进行人声检测，将存在人声的部分作为第二语音片段。3.根据权利要求2所述的方法，其特征在于，所述确定所述第二语音片段对应的声纹特征，包括：将所述第二语音片段输入到DNN模型中，得到所述第二语音片段对应的第一声纹特征向量；所述从声纹数据库中匹配出与所述声纹特征对应的人物信息，包括：对所述第一声纹特征向量与所述声纹数据库中存储的声纹特征向量进行匹配，将与所述第一声纹特征向量的相似度超过设定阈值的声纹特征向量作为目标声纹特征向量；将所述目标声纹特征向量对应的人物信息作为第一语音片段的人物信息。4.根据权利要求1-3任一所述的方法，其特征在于，所述方法，还包括：获取第三语音片段；确定所述第三语音片段对应的声纹特征；基于所述声纹特征，确定所述第三语音片段对应的人物信息；保存所述第三语音片段到所述人物信息对应的语音数据库中。5.根据权利要求4所述的方法，其特征在于，所述方法，还包括：接收对多个人物信息中目标人物信息的触发操作；基于所述目标人物信息从语音数据库中调取与所述目标人物信息对应的第四语音片段；播放所述第四语音片段。6.一种语音处理装置，其特征在于，包括：获取模块，用于获取第一语音片段；处理模块，用于从所述第一语音片段中提取人声部分，作为第二语音片段；所述处理模块，还用于确定所述第二语音片段对应的声纹特征；确定模块，用于从声纹数据库中匹配出与所述声纹特征对应的人物信息。7.一种语音处理系统，其特征在于，包括：麦克风，用于获取第一语音片段；处理器，用于从所述第一语音片段中提取人声部分，作为第二语音片段；确定所述第二语音片段对应的声纹特征；从声纹数据库中匹配出与所述声纹特征对应的人物信息。8.根据权利要求7所述的系统，其特征在于，所述处理器，具体用于对所述第一语音片段进行去噪处理，得到去除噪声后的所述第一语音片段；对去除噪声后的所述第一语音片2CN111816191A权利要求书2/2页段进行人声检测，将存在人声的部分作为第二语音片段。9.根据权利要求8所述的系统，其特征在于，所述处理器，还用于将所述第二语音片段输入到DNN模型中，得到所述第二语音片段对应的第一声纹特征向量；对所述第一声纹特征向量与所述声纹数据库中存储的声纹特征向量进行匹配，将与所述第一声纹特征向量的相似度超过设定阈值的声纹特征向量作为目标声纹特征向量；将所述目标声纹特征向量对应的人物信息作为第一语音片段的人物信息。10.根据权利要求7-9任一所述的系统，其特征在于，所述系统，还包括：所述麦克风，还用于获取第三语音片段；所述处理器，还用于确定所述第三语音片段对应的声纹特征；基于所述声纹特征，确定所述第三语音片段对应的人物信息；保存所述第三语音片段到所述人物信息对应的语音数据库中。11.根据权利要求10所述的系统，其特征在于，所述系统，还包括：所述处理器，还用于接收对多个人物信息中目标人物信息的触发

相关资料

语音处理方法、装置、系统及存储介质.pdf

本发明实施例涉及一种语音处理方法、装置、系统及存储介质，所述方法包括：获取第一语音片段；从所述第一语音片段中提取人声部分，作为第二语音片段；确定所述第二语音片段对应的声纹特征；从声纹数据库中匹配出与所述声纹特征对应的人物信息，由此方法，可以实现根据语音留言对用户的身份进行识别，从而对留言进行准备分类，并存储到用户对应的语音数据库中，当其他用户获取留言时可按照指定身份提取目标留言，避免时间的浪费，提升客户体验度。

2023-11-13

637KB

处理语音数据的方法、处理语音数据的装置及存储介质.pdf

本公开是关于处理语音数据的方法，方法包括：获取语料库，其中语料库包括多个回复语段，其中每个回复语段设置有第一删除值；获取当前的对话请求，其中当前的对话请求基于上一轮的回复语段生成；通过情绪识别模型确定当前的对话请求的情绪置信值；若当前的对话请求的情绪置信值大于上一轮的回复语段的第一删除值，则将上一轮的回复语段的第一删除值更新为当前的对话请求的情绪置信值，得到第二删除值；基于当前的对话请求以及所述第二删除值，选取语料库中的一个回复语段作为当前的对话请求的回复语段。可以实时反馈人机对话质量，对人机交互中的回复

2023-08-26

954KB

语音处理方法、装置、设备及存储介质.pdf

本发明公开了一种语音处理方法、装置、设备及存储介质，所述方法包括：对待处理的语音段进行分解处理，获取多帧分解语音段；基于调整算法对多帧所述分解语音段进行调整，获取多帧待叠加语音段；计算获得每帧所述待叠加语音段的幅度增益因子；基于所述幅度增益因子，对每帧所述待叠加语音段的幅度进行调整，确定目标幅度；基于所述目标幅度，获取目标语音段。本发明的技术方案，通过增加幅度增益因子严格控制待叠加语音段的幅度，解决了由于合成语音幅度过大导致的在实时通信的恢复过程中可能出现较大的失真的问题，实现了避免语音波形尾部幅度过大等

2023-07-22

514KB

语音提取方法、系统、装置及存储介质.pdf

本发明实施例公开了一种语音提取方法、系统、装置及存储介质，包括：获取目标说话人的特征向量及多通道混合语音的多通道特征向量；将特征向量及多通道特征向量输入到预设模型提取目标特征向量；根据目标特征向量及多通道特征向量确定目标语音信号；预设模型的训练方法包括:获取样本训练数据；将特征向量样本及多通道特征向量样本输入到特征提取模块得到第一特征向量；将第一特征向量及多通道特征向量样本输入到分离模块得到第二特征向量；根据特征向量样本与第二特征向量的目标函数计算的目标值更新特征提取模块和分离模块。本发明的技术方案，能够

2023-07-25

951KB

语音业务处理方法、装置、设备及存储介质.pdf

本申请实施例提供一种语音业务处理方法、装置、设备及存储介质，获取用于请求人工服务的呼叫请求；根据呼叫请求携带的服务信息，确定提供人工服务的目标服务端；基于目标服务端当前的通话模式，接通目标服务端与发起呼叫请求的客户端的通信连接，以使目标服务端对应的目标坐席通过通话模式为客户端提供人工服务。由于不同服务端支持的通话模式可能不同，通过本方案，基于目标服务端当前的通话模式来接通该目标服务端与客户端的通信连接，可以保证通话质量，进而提升服务质量。

2023-07-25

920KB