语音识别方法、装置、电子设备及存储介质-豆柴文库

语音识别方法、装置、电子设备及存储介质.pdf

2023-07-24

10金币

574KB

16页

依波****bc

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114299960A(43)申请公布日2022.04.08(21)申请号202111560478.6(22)申请日2021.12.20(71)申请人北京声智科技有限公司地址100094北京市海淀区北清路81号院一区1号楼6层601(72)发明人郭震陈孝良(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人王静(51)Int.Cl.G10L15/26(2006.01)G10L15/22(2006.01)G10L15/06(2013.01)权利要求书2页说明书10页附图3页(54)发明名称语音识别方法、装置、电子设备及存储介质(57)摘要本公开提供了一种语音识别方法、装置、电子设备及存储介质，属于互联网技术领域。所述方法包括：将目标文本内容与指令文本模板进行匹配；当目标文本内容与任一指令文本模板相匹配，目标指令词在目标文本内容中的位置满足预设位置条件，执行目标指令词对应的操作。本公开在调用语音识别模型得到目标文本内容后，未直接基于该目标文本内容中的目标指令词执行相应操作，而是将该目标文本内容与多个指令文本模板进行匹配，在目标文本内容与任一指令文本模板相匹配的情况下，根据目标指令词在目标文本内容的位置确定是否执行目标指令词对应的操作，从而避免将无指令意图的目标语音信息作为指令性语音信息，提高了识别结果的准确性，减少了误识别次数。CN114299960ACN114299960A权利要求书1/2页1.一种语音识别方法，其特征在于，所述方法包括：获取目标语音信息；调用语音识别模型，对所述目标语音信息进行识别，所述语音识别模型用于将语音信息转换为文本内容；当得到包含目标指令词的目标文本内容，将所述目标文本内容与多个指令文本模板进行匹配；当所述目标文本内容与任一指令文本模板相匹配，且所述目标指令词在所述指令文本模板中的位置满足预设位置条件，执行所述目标指令词对应的操作。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：当所述目标文本内容与所述多个指令文本模板均不匹配，不执行所述目标指令词对应的操作；或者，当所述目标文本内容与任一指令文本模板相匹配，所述目标指令词在所述目标文本内容中的位置不满足预设位置条件，不执行所述目标指令词对应的操作。3.根据权利要求1所述的方法，其特征在于，所述语音识别模型的构建过程为：获取多个语音训练样本，所述多个语音训练样本包含的非指令词中所有字音相同的单字均采用同一代表字表示；基于所述多个语音训练样本，构建所述语音识别模型。4.根据权利要求3所述的方法，其特征在于，所述多个语音训练样本包括多个语音训练正样本和多个语音训练负样本，每个语音训练正样本包含一个指令词，所述获取多个语音训练样本，包括：按照预设比例，获取语音训练正样本和语音训练负样本，得到所述多个语音训练样本，所述预设比例用于实现各个指令词在所述多个语音训练样本中的出现频率满足预设频率条件。5.根据权利要求3所述的方法，其特征在于，所述基于所述多个语音训练样本，构建所述语音识别模型，包括：获取所述多个语音训练样本包含的各个词语组合；确定每个词语组合在同字数的词语组合中的出现频率；根据不同字数的词语组合的出现频率，构建所述语音识别模型。6.一种语音识别装置，其特征在于，所述装置包括：第一获取模块，用于获取目标语音信息；识别模块，用于调用语音识别模型，对所述目标语音信息进行识别，所述语音识别模型用于将语音信息转换为文本内容；匹配模块，用于当得到包含目标指令词的目标文本内容，将所述目标文本内容与多个指令文本模板进行匹配；执行模块，用于当所述目标文本内容与任一指令文本模板匹配，且所述目标指令词在所述目标文本内容中的位置满足预设位置条件，执行所述目标指令词对应的操作。7.根据权利要求6所述的装置，其特征在于，所述执行模块，用于当所述目标文本内容与所述多个指令文本模板均不匹配，不执行所述目标指令词对应的操作；或者，所述执行模块，用于当所述目标文本内容与任一指令文本模板相匹配，所述目标指令2CN114299960A权利要求书2/2页词在所述目标文本内容中的位置不满足预设位置条件，不执行所述目标指令词对应的操作。8.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1至5中任一项所述的语音识别方法。9.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求1至5中任一项所述的语音识别方法。10.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序代码，所述计算机程序代码存储在计算机

相关资料

语音识别方法、装置、电子设备及存储介质.pdf

本公开提供了一种语音识别方法、装置、电子设备及存储介质，属于互联网技术领域。所述方法包括：将目标文本内容与指令文本模板进行匹配；当目标文本内容与任一指令文本模板相匹配，目标指令词在目标文本内容中的位置满足预设位置条件，执行目标指令词对应的操作。本公开在调用语音识别模型得到目标文本内容后，未直接基于该目标文本内容中的目标指令词执行相应操作，而是将该目标文本内容与多个指令文本模板进行匹配，在目标文本内容与任一指令文本模板相匹配的情况下，根据目标指令词在目标文本内容的位置确定是否执行目标指令词对应的操作，从而避

2023-07-24

574KB

语音识别方法、装置、电子设备及存储介质.pdf

本发明实施例涉及一种语音识别方法、装置、电子设备及存储介质，所述方法包括：获取待识别语音，提取待识别语音的语音特征和拼音序列，将语音特征和拼音序列与已构建的语言知识图谱进行匹配，根据匹配结果确定待识别语音对应的目标第一语言以及目标第一语言文本序列，其中，语言知识图谱中包括多种第一语言的语音特征、预设词汇集、每个预设词汇的拼音标注，以及三者之间的映射关系；根据目标第一语言对应的第二语言映射知识图谱，将目标第一语言文本序列映射为第二语言文本序列，其中，第二语言映射知识图谱中包括多个第一语言文本和第二语言文本之

2023-05-31

2MB

语音识别方法、装置、电子设备及存储介质.pdf

本发明实施例提供一种语音识别方法、装置、电子设备及存储介质，该方法包括：将待识别语音输入声学模型中，得到所述待识别语音对应的音素序列；将所述音素序列输入第一语言模型中，得到所述待识别语音对应的多个候选解码文本；将所述多个候选解码文本输入第二语言模型中，得到各所述候选解码文本属于各标准语法结构的第一预测结果；基于所述第一预测结果确定所述待识别语音的识别结果。本发明实施例提供的语音识别方法、装置、电子设备及存储介质提高了语音识别的准确度。

2023-06-01

1.9MB

语音识别方法、装置、存储介质及电子设备.pdf

本发明提供了一种语音识别方法、装置、存储介质及电子设备，所述语音识别方法包括如下步骤：获取多个样本语音数据；采用梅尔频率倒普系数对每个样本语音数据进行语音特征提取，以得到每个样本语音数据的特征矩阵；按照一预设值构建每个样本语音数据的特征矩阵的大小，以得到归一化的特征矩阵的集合；基于所述归一化的特征矩阵的集合以支持向量机算法建立一分类模型；通过所述分类模型识别目标语音数据。本发明可以准确区分多种语言的目标语音数据，特别是带有彩铃或振铃的外呼呼叫失败的语音数据。

2023-06-25

558KB

语音识别方法、装置、电子设备及存储介质.pdf

本申请涉及语音识别技术领域，公开了一种语音识别方法、装置、电子设备及存储介质，其中，该语音识别方法包括：获取待识别语音；通过语音识别模型对所述待识别语音进行识别，获得语音识别结果；其中，所述语音识别模型通过以下方式训练得到：基于各初始训练样本对初始语音识别模型进行训练，得到初步训练后的识别模型；获得每个所述初始训练样本在通过所述初步训练后的识别模型进行识别时所对应的识别易错率表征信息；根据所述表征信息从各所述初始训练样本中选取目标样本；基于各所述目标样本对所述初步训练后的识别模型进行训练，得到所述语音识别

2023-07-24

1KB