语音识别方法、装置、电子设备及存储介质-豆柴文库

语音识别方法、装置、电子设备及存储介质.pdf

2023-05-31

10金币

2MB

22页

是立****92

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共22页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116013254A(43)申请公布日2023.04.25(21)申请号202211627294.1(22)申请日2022.12.16(71)申请人珠海格力电器股份有限公司地址519070广东省珠海市珠海横琴新区汇通三路108号办公608申请人珠海联云科技有限公司(72)发明人郝晓波李绍斌唐杰姜旭东黄鑫(74)专利代理机构北京华夏泰和知识产权代理有限公司11662专利代理师杜欣(51)Int.Cl.G10L15/00(2013.01)G10L15/04(2013.01)权利要求书2页说明书15页附图4页(54)发明名称语音识别方法、装置、电子设备及存储介质(57)摘要本发明实施例涉及一种语音识别方法、装置、电子设备及存储介质，所述方法包括：获取待识别语音，提取待识别语音的语音特征和拼音序列，将语音特征和拼音序列与已构建的语言知识图谱进行匹配，根据匹配结果确定待识别语音对应的目标第一语言以及目标第一语言文本序列，其中，语言知识图谱中包括多种第一语言的语音特征、预设词汇集、每个预设词汇的拼音标注，以及三者之间的映射关系；根据目标第一语言对应的第二语言映射知识图谱，将目标第一语言文本序列映射为第二语言文本序列，其中，第二语言映射知识图谱中包括多个第一语言文本和第二语言文本之间的映射关系。由此，能够实现提高语音识别的效率，提升用户体验。CN116013254ACN116013254A权利要求书1/2页1.一种语音识别方法，其特征在于，所述方法包括：获取待识别语音；提取所述待识别语音的语音特征和拼音序列；将所述语音特征和所述拼音序列与已构建的语言知识图谱进行匹配，根据匹配结果确定所述待识别语音对应的目标第一语言以及目标第一语言文本序列，其中，所述语言知识图谱中包括多种第一语言的语音特征、预设词汇集、每个预设词汇的拼音标注，以及三者之间的映射关系；根据所述目标第一语言对应的第二语言映射知识图谱，将所述目标第一语言文本序列映射为第二语言文本序列，其中，所述第二语言映射知识图谱中包括多个第一语言文本和第二语言文本之间的映射关系。2.根据权利要求1所述的方法，其特征在于，所述将所述语音特征和所述拼音序列与已构建的语言知识图谱进行匹配，根据匹配结果确定所述待识别语音对应的目标第一语言以及目标第一语言文本序列，包括：将所述语音特征与已构建的语言知识图谱进行匹配，得到所述语言知识图谱中与所述语音特征相匹配的至少一个目标语音特征；将每个所述目标语音特征对应的所述第一语言确定为所述待识别语音对应的候选第一语言；从至少一个所述候选第一语言中确定所述待识别语音对应的目标第一语言，并根据所述目标第一语言和所述拼音序列确定所述待识别语音对应的目标第一语言文本序列。3.根据权利要求2所述的方法，其特征在于，所述从至少一个所述候选第一语言中确定所述待识别语音对应的目标第一语言，并根据所述目标第一语言和所述拼音序列确定所述待识别语音对应的目标第一语言文本序列，包括：针对每个所述候选第一语言执行以下处理：将所述拼音序列与所述候选第一语言在所述语言知识图谱中对应的预设词汇的拼音标注进行匹配，得到所述拼音序列在所述候选第一语言下对应的候选文本序列，并将所述候选文本序列归入所述待识别语音对应的候选文本序列集；从所述候选文本序列集中确定所述待识别语音对应的目标第一语言文本序列，以及将所述目标第一语言文本序列对应的所述候选第一语言，确定为所述待识别语音对应的目标第一语言。4.根据权利要求3所述的方法，其特征在于，将所述拼音序列与所述候选第一语言在所述语言知识图谱中对应的预设词汇的拼音标注进行匹配，得到所述拼音序列在所述候选第一语言下对应的候选文本序列，包括：将所述拼音序列进行分割，得到多个音节；针对每个所述音节，从所述候选第一语言在所述语言知识图谱对应的子知识图谱中，确定与所述音节相匹配的至少一个目标音节；从所述子知识图谱中获取每个所述目标音节对应的目标预设词汇；按照所述多个音节在所述拼音序列中的排列顺序，将每个所述目标音节对应的所述目标预设词汇进行全排列组合，得到所述拼音序列在所述候选第一语言下对应的多个候选文本序列。2CN116013254A权利要求书2/2页5.根据权利要求3所述的方法，其特征在于，所述从所述候选文本序列集中确定所述待识别语音对应的目标第一语言文本序列，包括：针对所述候选文本序列集中的每个所述候选文本序列执行以下处理：对所述候选文本序列进行分词处理，得到多个分词；针对每相邻的两个所述分词，确定该两个分词之间的分词相关度；根据每相邻的两个所述分词之间的所述分词相关度，确定所述候选文本序列的规范化参数，其中，所述规范化参数用于表征所述候选文本序列的规范化程度；将对应的所述规范化参数最高的所述候选文本

相关资料

语音识别方法、装置、电子设备及存储介质.pdf

本发明公开了一种语音识别方法、装置、电子设备及存储介质，所述方法包括：若确定上一段语音信号的识别结果为不完整文本，将上一段语音信号的识别结果确定为历史识别信息；基于历史识别信息，对当前获取到的语音信号进行语音识别。本发明实施例提供的技术方案，在确定上一段语音信号的识别结果不是完整文本后，将上一段语音信号的识别结果作为识别当前获取到的语音信号时的历史识别信息，在对当前获取到的语音信号计算语言模型得分时，增加了历史识别信息带来的影响，从而提升语音识别准确率。

2024-01-04

557KB

语音识别方法、装置、电子设备及存储介质.pdf

本发明公开了一种语音识别方法、装置、电子设备及存储介质，所述方法包括：获取输入语音以及输入语音对应的用户ID；根据用户ID，在解码网络中，搜索输入语音对应的最优路径，解码网络中各词节点之间的路径标记有用户ID；根据最优路径确定输入语音对应的文本信息。本发明实施例提供的技术方案，基于一套解码网络，即可为用户提供个性化的语音识别服务，同时大大节省了硬件资源。

2024-01-04

683KB

语音识别方法、装置、电子设备及存储介质.pdf

本发明实施例涉及一种语音识别方法、装置、电子设备及存储介质，所述方法包括：获取待识别语音，提取待识别语音的语音特征和拼音序列，将语音特征和拼音序列与已构建的语言知识图谱进行匹配，根据匹配结果确定待识别语音对应的目标第一语言以及目标第一语言文本序列，其中，语言知识图谱中包括多种第一语言的语音特征、预设词汇集、每个预设词汇的拼音标注，以及三者之间的映射关系；根据目标第一语言对应的第二语言映射知识图谱，将目标第一语言文本序列映射为第二语言文本序列，其中，第二语言映射知识图谱中包括多个第一语言文本和第二语言文本之

2023-05-31

2MB

语音识别方法、装置、电子设备及存储介质.pdf

本公开提供了一种语音识别方法、装置、电子设备及存储介质，属于互联网技术领域。所述方法包括：将目标文本内容与指令文本模板进行匹配；当目标文本内容与任一指令文本模板相匹配，目标指令词在目标文本内容中的位置满足预设位置条件，执行目标指令词对应的操作。本公开在调用语音识别模型得到目标文本内容后，未直接基于该目标文本内容中的目标指令词执行相应操作，而是将该目标文本内容与多个指令文本模板进行匹配，在目标文本内容与任一指令文本模板相匹配的情况下，根据目标指令词在目标文本内容的位置确定是否执行目标指令词对应的操作，从而避

2023-07-24

574KB

语音识别方法、装置、电子设备及存储介质.pdf

本申请涉及语音识别技术领域，公开了一种语音识别方法、装置、电子设备及存储介质，其中，该语音识别方法包括：获取待识别语音；通过语音识别模型对所述待识别语音进行识别，获得语音识别结果；其中，所述语音识别模型通过以下方式训练得到：基于各初始训练样本对初始语音识别模型进行训练，得到初步训练后的识别模型；获得每个所述初始训练样本在通过所述初步训练后的识别模型进行识别时所对应的识别易错率表征信息；根据所述表征信息从各所述初始训练样本中选取目标样本；基于各所述目标样本对所述初步训练后的识别模型进行训练，得到所述语音识别

2023-07-24

1KB