预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113963694A(43)申请公布日2022.01.21(21)申请号202010700307.8(22)申请日2020.07.20(71)申请人中移(苏州)软件技术有限公司地址215163江苏省苏州市高新区昆仑山路58号1幢申请人中国移动通信集团有限公司(72)发明人姜雪婷(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人张静张颖玲(51)Int.Cl.G10L15/22(2006.01)G10L21/0272(2013.01)G10L25/63(2013.01)权利要求书2页说明书15页附图6页(54)发明名称一种语音识别方法、语音识别装置、电子设备及存储介质(57)摘要本申请公开了一种语音识别方法、语音识别装置,电子设备及存储介质,所述方法包括:获取当前语音识别场景下的多个语音数据;多个语音数据包括多个语音采集器采集的当前语音识别场景下的多个对象的语音数据;多个语音采集器位于当前语音识别场景中的不同位置;基于多个语音数据,生成与多个对象中的每一对象关联的目标语音数据;每一对象关联的目标语音数据来源于多个语音数据中的至少两个语音数据;基于多个目标语音数据生成语音识别结果,并输出语音识别结果;如此,无需人为的分析语音数据,减少了语音数据的计算量,保证了语音分析结果的准确度。CN113963694ACN113963694A权利要求书1/2页1.一种语音识别方法,其特征在于,所述方法包括:获取当前语音识别场景下的多个语音数据;所述多个语音数据包括多个语音采集器采集的所述当前语音识别场景下的多个对象的语音数据;所述多个语音采集器位于所述当前语音识别场景中的不同位置;基于所述多个语音数据,生成与多个对象中的每一对象关联的目标语音数据;所述每一对象关联的目标语音数据来源于所述多个语音数据中的至少两个语音数据;基于多个所述目标语音数据生成语音识别结果,并输出所述语音识别结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个语音数据,生成与多个对象中的每一对象关联的目标语音数据,包括:将所述多个语音数据中的每一语音数据进行分割,得到所述每一语音数据分割后的每一子语音数据集合;所述每一子语音数据集合包括多段语音数据;获取所述每一子语音数据集合关联的多个声纹特征;基于所述每一子语音数据集合和所述每一子语音数据集合关联的多个声纹特征,生成所述每一对象关联的目标语音数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述每一子语音数据集合和所述每一子语音数据集合关联的多个声纹特征,生成所述每一对象关联的目标语音数据,包括:确定多个所述子语音数据集合中具有同一声纹特征且具有同一时间戳的多个子语音数据;从所述多个子语音数据中确定目标子语音数据,得到同一声纹特征关联的多个目标子语音数据;基于所述多个目标子语音数据以及所述多个目标子语音数据对应的时间戳,生成所述每一对象关联的目标语音数据。4.根据权利要求3所述的方法,其特征在于,所述目标子语音数据为所述多个子语音数据中具有最大振幅的语音数据。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述基于所述目标语音数据生成语音识别结果之前,所述方法还包括:获取所述多个语音采集器在所述当前语音识别场景中的第一位置信息;相应的,所述基于多个所述目标语音数据生成语音识别结果,还包括:基于所述第一位置信息和多个所述目标语音数据,确定所述多个对象中每一对象在所述当前语音识别场景中的第二位置信息;基于多个所述第二位置信息和多个所述目标语音数据,生成语音识别结果。6.根据权利要求5所述的方法,其特征在于,所述基于多个所述第二位置信息和多个所述目标语音数据,生成语音识别结果,包括:对多个所述目标语音数据进行语音情感识别,得到多个第一识别结果;获取多个所述目标语音数据关联的多个目标文本数据;对多个所述目标文本数据进行语义识别,得到多个第二识别结果;基于多个所述第一识别结果、多个所述第二识别结果、多个所述目标文本数据和多个所述第二位置信息,生成所述语音识别结果。7.根据权利要求6所述的方法,其特征在于,所述基于多个所述第一识别结果、多个所2CN113963694A权利要求书2/2页述第二识别结果、多个所述目标文本数据和多个所述第二位置信息,生成所述语音识别结果,包括:基于每一对象关联的所述第一识别结果和每一对象关联的所述第二识别结果,提取每一对象关联的所述目标文本数据的特征信息;基于每一对象关联的特征信息和每一对象关联的所述第二位置信息,生成方位语音图;所述语音识别结果包括所述方位语音图。8.一种语音识别装置,其特征在于,所述装置包括:获取单元,用于获取当前语音识别场景下的多个语音数据;所述多个语音数据包括多个语音