一种语音识别方法、语音识别装置、电子设备及存储介质-豆柴文库

一种语音识别方法、语音识别装置、电子设备及存储介质.pdf

2023-07-24

10金币

799KB

24页

雨巷****怡轩

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共24页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113963694A(43)申请公布日2022.01.21(21)申请号202010700307.8(22)申请日2020.07.20(71)申请人中移(苏州)软件技术有限公司地址215163江苏省苏州市高新区昆仑山路58号1幢申请人中国移动通信集团有限公司(72)发明人姜雪婷(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人张静张颖玲(51)Int.Cl.G10L15/22(2006.01)G10L21/0272(2013.01)G10L25/63(2013.01)权利要求书2页说明书15页附图6页(54)发明名称一种语音识别方法、语音识别装置、电子设备及存储介质(57)摘要本申请公开了一种语音识别方法、语音识别装置，电子设备及存储介质，所述方法包括：获取当前语音识别场景下的多个语音数据；多个语音数据包括多个语音采集器采集的当前语音识别场景下的多个对象的语音数据；多个语音采集器位于当前语音识别场景中的不同位置；基于多个语音数据，生成与多个对象中的每一对象关联的目标语音数据；每一对象关联的目标语音数据来源于多个语音数据中的至少两个语音数据；基于多个目标语音数据生成语音识别结果，并输出语音识别结果；如此，无需人为的分析语音数据，减少了语音数据的计算量，保证了语音分析结果的准确度。CN113963694ACN113963694A权利要求书1/2页1.一种语音识别方法，其特征在于，所述方法包括：获取当前语音识别场景下的多个语音数据；所述多个语音数据包括多个语音采集器采集的所述当前语音识别场景下的多个对象的语音数据；所述多个语音采集器位于所述当前语音识别场景中的不同位置；基于所述多个语音数据，生成与多个对象中的每一对象关联的目标语音数据；所述每一对象关联的目标语音数据来源于所述多个语音数据中的至少两个语音数据；基于多个所述目标语音数据生成语音识别结果，并输出所述语音识别结果。2.根据权利要求1所述的方法，其特征在于，所述基于所述多个语音数据，生成与多个对象中的每一对象关联的目标语音数据，包括：将所述多个语音数据中的每一语音数据进行分割，得到所述每一语音数据分割后的每一子语音数据集合；所述每一子语音数据集合包括多段语音数据；获取所述每一子语音数据集合关联的多个声纹特征；基于所述每一子语音数据集合和所述每一子语音数据集合关联的多个声纹特征，生成所述每一对象关联的目标语音数据。3.根据权利要求2所述的方法，其特征在于，所述基于所述每一子语音数据集合和所述每一子语音数据集合关联的多个声纹特征，生成所述每一对象关联的目标语音数据，包括：确定多个所述子语音数据集合中具有同一声纹特征且具有同一时间戳的多个子语音数据；从所述多个子语音数据中确定目标子语音数据，得到同一声纹特征关联的多个目标子语音数据；基于所述多个目标子语音数据以及所述多个目标子语音数据对应的时间戳，生成所述每一对象关联的目标语音数据。4.根据权利要求3所述的方法，其特征在于，所述目标子语音数据为所述多个子语音数据中具有最大振幅的语音数据。5.根据权利要求1至3中任一项所述的方法，其特征在于，所述基于所述目标语音数据生成语音识别结果之前，所述方法还包括：获取所述多个语音采集器在所述当前语音识别场景中的第一位置信息；相应的，所述基于多个所述目标语音数据生成语音识别结果，还包括：基于所述第一位置信息和多个所述目标语音数据，确定所述多个对象中每一对象在所述当前语音识别场景中的第二位置信息；基于多个所述第二位置信息和多个所述目标语音数据，生成语音识别结果。6.根据权利要求5所述的方法，其特征在于，所述基于多个所述第二位置信息和多个所述目标语音数据，生成语音识别结果，包括：对多个所述目标语音数据进行语音情感识别，得到多个第一识别结果；获取多个所述目标语音数据关联的多个目标文本数据；对多个所述目标文本数据进行语义识别，得到多个第二识别结果；基于多个所述第一识别结果、多个所述第二识别结果、多个所述目标文本数据和多个所述第二位置信息，生成所述语音识别结果。7.根据权利要求6所述的方法，其特征在于，所述基于多个所述第一识别结果、多个所2CN113963694A权利要求书2/2页述第二识别结果、多个所述目标文本数据和多个所述第二位置信息，生成所述语音识别结果，包括：基于每一对象关联的所述第一识别结果和每一对象关联的所述第二识别结果，提取每一对象关联的所述目标文本数据的特征信息；基于每一对象关联的特征信息和每一对象关联的所述第二位置信息，生成方位语音图；所述语音识别结果包括所述方位语音图。8.一种语音识别装置，其特征在于，所述装置包括：获取单元，用于获取当前语音识别场景下的多个语音数据；所述多个语音数据包括多个语音

相关资料

一种语音识别方法、语音识别装置、电子设备及存储介质.pdf

本申请公开了一种语音识别方法、语音识别装置，电子设备及存储介质，所述方法包括：获取当前语音识别场景下的多个语音数据；多个语音数据包括多个语音采集器采集的当前语音识别场景下的多个对象的语音数据；多个语音采集器位于当前语音识别场景中的不同位置；基于多个语音数据，生成与多个对象中的每一对象关联的目标语音数据；每一对象关联的目标语音数据来源于多个语音数据中的至少两个语音数据；基于多个目标语音数据生成语音识别结果，并输出语音识别结果；如此，无需人为的分析语音数据，减少了语音数据的计算量，保证了语音分析结果的准确度。

2023-07-24

799KB

语音识别方法、装置、电子设备及存储介质.pdf

本公开提供了一种语音识别方法、装置、电子设备及存储介质，属于互联网技术领域。所述方法包括：将目标文本内容与指令文本模板进行匹配；当目标文本内容与任一指令文本模板相匹配，目标指令词在目标文本内容中的位置满足预设位置条件，执行目标指令词对应的操作。本公开在调用语音识别模型得到目标文本内容后，未直接基于该目标文本内容中的目标指令词执行相应操作，而是将该目标文本内容与多个指令文本模板进行匹配，在目标文本内容与任一指令文本模板相匹配的情况下，根据目标指令词在目标文本内容的位置确定是否执行目标指令词对应的操作，从而避

2023-07-24

574KB

语音识别方法、装置、电子设备及存储介质.pdf

本发明实施例涉及一种语音识别方法、装置、电子设备及存储介质，所述方法包括：获取待识别语音，提取待识别语音的语音特征和拼音序列，将语音特征和拼音序列与已构建的语言知识图谱进行匹配，根据匹配结果确定待识别语音对应的目标第一语言以及目标第一语言文本序列，其中，语言知识图谱中包括多种第一语言的语音特征、预设词汇集、每个预设词汇的拼音标注，以及三者之间的映射关系；根据目标第一语言对应的第二语言映射知识图谱，将目标第一语言文本序列映射为第二语言文本序列，其中，第二语言映射知识图谱中包括多个第一语言文本和第二语言文本之

2023-05-31

2MB

语音识别方法、装置、电子设备及存储介质.pdf

本发明实施例提供一种语音识别方法、装置、电子设备及存储介质，该方法包括：将待识别语音输入声学模型中，得到所述待识别语音对应的音素序列；将所述音素序列输入第一语言模型中，得到所述待识别语音对应的多个候选解码文本；将所述多个候选解码文本输入第二语言模型中，得到各所述候选解码文本属于各标准语法结构的第一预测结果；基于所述第一预测结果确定所述待识别语音的识别结果。本发明实施例提供的语音识别方法、装置、电子设备及存储介质提高了语音识别的准确度。

2023-06-01

1.9MB

语音识别方法、装置、存储介质及电子设备.pdf

本发明提供了一种语音识别方法、装置、存储介质及电子设备，所述语音识别方法包括如下步骤：获取多个样本语音数据；采用梅尔频率倒普系数对每个样本语音数据进行语音特征提取，以得到每个样本语音数据的特征矩阵；按照一预设值构建每个样本语音数据的特征矩阵的大小，以得到归一化的特征矩阵的集合；基于所述归一化的特征矩阵的集合以支持向量机算法建立一分类模型；通过所述分类模型识别目标语音数据。本发明可以准确区分多种语言的目标语音数据，特别是带有彩铃或振铃的外呼呼叫失败的语音数据。

2023-06-25

558KB