预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111816191A(43)申请公布日2020.10.23(21)申请号202010666203.XG10L17/20(2013.01)(22)申请日2020.07.08(71)申请人珠海格力电器股份有限公司地址519070广东省珠海市前山金鸡西路申请人珠海联云科技有限公司(72)发明人李瑞贾巨涛张伟伟戴林胡广绪(74)专利代理机构北京华夏泰和知识产权代理有限公司11662代理人卢万腾王卫忠(51)Int.Cl.G10L17/22(2013.01)G10L17/02(2013.01)G10L17/04(2013.01)G10L17/06(2013.01)权利要求书2页说明书9页附图3页(54)发明名称语音处理方法、装置、系统及存储介质(57)摘要本发明实施例涉及一种语音处理方法、装置、系统及存储介质,所述方法包括:获取第一语音片段;从所述第一语音片段中提取人声部分,作为第二语音片段;确定所述第二语音片段对应的声纹特征;从声纹数据库中匹配出与所述声纹特征对应的人物信息,由此方法,可以实现根据语音留言对用户的身份进行识别,从而对留言进行准备分类,并存储到用户对应的语音数据库中,当其他用户获取留言时可按照指定身份提取目标留言,避免时间的浪费,提升客户体验度。CN111816191ACN111816191A权利要求书1/2页1.一种语音处理方法,其特征在于,包括:获取第一语音片段;从所述第一语音片段中提取人声部分,作为第二语音片段;确定所述第二语音片段对应的声纹特征;从声纹数据库中匹配出与所述声纹特征对应的人物信息。2.根据权利要求1所述的方法,其特征在于,所述从所述第一语音片段中提取人声部分,作为第二语音片段,包括:对所述第一语音片段进行去噪处理,得到去除噪声后的所述第一语音片段;对去除噪声后的所述第一语音片段进行人声检测,将存在人声的部分作为第二语音片段。3.根据权利要求2所述的方法,其特征在于,所述确定所述第二语音片段对应的声纹特征,包括:将所述第二语音片段输入到DNN模型中,得到所述第二语音片段对应的第一声纹特征向量;所述从声纹数据库中匹配出与所述声纹特征对应的人物信息,包括:对所述第一声纹特征向量与所述声纹数据库中存储的声纹特征向量进行匹配,将与所述第一声纹特征向量的相似度超过设定阈值的声纹特征向量作为目标声纹特征向量;将所述目标声纹特征向量对应的人物信息作为第一语音片段的人物信息。4.根据权利要求1-3任一所述的方法,其特征在于,所述方法,还包括:获取第三语音片段;确定所述第三语音片段对应的声纹特征;基于所述声纹特征,确定所述第三语音片段对应的人物信息;保存所述第三语音片段到所述人物信息对应的语音数据库中。5.根据权利要求4所述的方法,其特征在于,所述方法,还包括:接收对多个人物信息中目标人物信息的触发操作;基于所述目标人物信息从语音数据库中调取与所述目标人物信息对应的第四语音片段;播放所述第四语音片段。6.一种语音处理装置,其特征在于,包括:获取模块,用于获取第一语音片段;处理模块,用于从所述第一语音片段中提取人声部分,作为第二语音片段;所述处理模块,还用于确定所述第二语音片段对应的声纹特征;确定模块,用于从声纹数据库中匹配出与所述声纹特征对应的人物信息。7.一种语音处理系统,其特征在于,包括:麦克风,用于获取第一语音片段;处理器,用于从所述第一语音片段中提取人声部分,作为第二语音片段;确定所述第二语音片段对应的声纹特征;从声纹数据库中匹配出与所述声纹特征对应的人物信息。8.根据权利要求7所述的系统,其特征在于,所述处理器,具体用于对所述第一语音片段进行去噪处理,得到去除噪声后的所述第一语音片段;对去除噪声后的所述第一语音片2CN111816191A权利要求书2/2页段进行人声检测,将存在人声的部分作为第二语音片段。9.根据权利要求8所述的系统,其特征在于,所述处理器,还用于将所述第二语音片段输入到DNN模型中,得到所述第二语音片段对应的第一声纹特征向量;对所述第一声纹特征向量与所述声纹数据库中存储的声纹特征向量进行匹配,将与所述第一声纹特征向量的相似度超过设定阈值的声纹特征向量作为目标声纹特征向量;将所述目标声纹特征向量对应的人物信息作为第一语音片段的人物信息。10.根据权利要求7-9任一所述的系统,其特征在于,所述系统,还包括:所述麦克风,还用于获取第三语音片段;所述处理器,还用于确定所述第三语音片段对应的声纹特征;基于所述声纹特征,确定所述第三语音片段对应的人物信息;保存所述第三语音片段到所述人物信息对应的语音数据库中。11.根据权利要求10所述的系统,其特征在于,所述系统,还包括:所述处理器,还用于接收对多个人物信息中目标人物信息的触发