语音识别方法、电子设备及计算机可读存储介质-豆柴文库

语音识别方法、电子设备及计算机可读存储介质.pdf

2023-07-25

10金币

1MB

20页

音景****ka

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共20页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113889093A(43)申请公布日2022.01.04(21)申请号202111292450.9(22)申请日2021.11.03(71)申请人上海喜马拉雅科技有限公司地址201100上海市闵行区紫星路588号2幢2062室(72)发明人吕翔卢恒印晶晶(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人张欣欣(51)Int.Cl.G10L15/06(2013.01)G10L15/22(2006.01)G10L15/26(2006.01)权利要求书2页说明书9页附图8页(54)发明名称语音识别方法、电子设备及计算机可读存储介质(57)摘要本发明实施方式提出一种语音识别方法、电子设备及计算机可读存储介质，属于语音识别的领域，方法包括：将待识别语音进行转文字处理，在每个时间步识别出多个识别词和各识别词的后验概率，将每个时间步的各识别词与前后两个时间步的所有识别词一一组合，得到多条解码路径，并针对每条解码路径，遍历字典树，查看该解码路径上的所有识别词是否与字典树上的热词匹配，以得到匹配结果，从而根据各识别词的后验概率及匹配结果，得到每条解码路径的置信分数，进而根据置信分数，从各条解码路径中确定目标词句，采用字典树进行热词匹配，没有对fst组件的依赖，降低热词功能的算法复杂度，以更快地识别热词，进而提高语音识别的速度和准确性。CN113889093ACN113889093A权利要求书1/2页1.一种语音识别方法，其特征在于，所述方法包括：将待识别语音进行转文字处理，得到在每个时间步识别出的多个识别词和各识别词的后验概率；将每个所述时间步的各所述识别词与前后两个所述时间步的所有识别词一一组合，得到多条解码路径；针对每条解码路径，遍历预设的字典树，查看该解码路径上的所有识别词是否与所述字典树上的热词匹配，以得到匹配结果；其中，所述字典树包括根节点、多个子节点及多个叶子节点，从根节点到一个叶子节点组成一个热词；根据各所述识别词的所述后验概率以及所述匹配结果，得到每条所述解码路径的置信分数，根据所述置信分数，从各条所述解码路径中确定目标词句。2.根据权利要求1所述的语音识别方法，其特征在于，所述方法还包括构建字典树的步骤，该步骤包括：基于解码词典，以最细粒度对热词表上的各热词进行分词，得到各热词的分词结果，所述分词结果包括多个有序的基本词；设置根节点，将第一个所述热词的第一个基本词作为所述根节点的子节点，将该热词剩余每个所述基本词作为该基本词之前的基本词的子节点，最后一个基本词作为叶子节点；对于剩余每个所述热词的第一个所述基本词，查询该基本词是否与所述根节点的至少一个子节点相同，若否，则创建新的子节点，并基于该子节点和剩余所述基本词，创建该子节点之后的子节点；否则，基于所述根节点的该子节点和剩余所述基本词，创建后续子节点；直至处理完所有所述热词，得到字典树。3.根据权利要求1或2所述的语音识别方法，其特征在于，在所述得到匹配结果的步骤之后，在所述根据各所述识别词的所述后验概率以及所述匹配结果，得到每条所述解码路径的置信分数的步骤之前，所述方法还包括：给所述匹配结果为成功的每条所述解码路径增加预设的概率值。4.根据权利要求3所述的语音识别方法，其特征在于，所述根据各所述识别词的所述后验概率以及所述匹配结果，得到每条所述解码路径的置信分数的步骤，包括：将每条所述解码路径上各所述识别词的所述后验概率相加，并加上所述概率值，得到各条所述解码路径的置信分数；其中，所述匹配结果为失败的解码路径的概率值小于所述匹配结果为成功的解码路径的概率值。5.根据权利要求1或2所述的语音识别方法，其特征在于，在所述得到在每个时间步识别出的多个识别词和各识别词的后验概率的步骤之后，在所述将每个所述时间步的各所述识别词与前后两个所述时间步的所有识别词一一组合的步骤之前，所述方法还包括：分别将各所述识别词的后验概率与阈值进行比较，并剔除所述后验概率小于阈值的识别词。6.根据权利要求1或2所述的语音识别方法，其特征在于，所述针对每条解码路径，遍历预设的字典树，查看该解码路径上的所有词是否与所述字典树上的热词匹配的步骤，包括：2CN113889093A权利要求书2/2页针对每条所述解码路径，若该解码路径的第一个识别词至最后一个识别词，与所述字典树的所述根节点的至少一个子节点到至少一个叶子节点组成的热词对应，则该解码路径与所述字典树上的热词匹配，否则该解码路径与所述字典树上的热词不匹配。7.根据权利要求1所述的语音识别方法，其特征在于，所述将待识别语音进行转文字处理，得到在每个时间步识别出的多个识别词和识别词的后验概率的步骤，包括：将待识别语音输入预设的神经网络，每间隔一个时

相关资料

语音识别方法、电子设备及计算机可读存储介质.pdf

本发明实施方式提出一种语音识别方法、电子设备及计算机可读存储介质，属于语音识别的领域，方法包括：将待识别语音进行转文字处理，在每个时间步识别出多个识别词和各识别词的后验概率，将每个时间步的各识别词与前后两个时间步的所有识别词一一组合，得到多条解码路径，并针对每条解码路径，遍历字典树，查看该解码路径上的所有识别词是否与字典树上的热词匹配，以得到匹配结果，从而根据各识别词的后验概率及匹配结果，得到每条解码路径的置信分数，进而根据置信分数，从各条解码路径中确定目标词句，采用字典树进行热词匹配，没有对fst组件的

2023-07-25

1MB

语音识别方法及装置、电子设备、计算机可读存储介质.pdf

本发明公开了一种语音识别方法及装置、电子设备、计算机可读存储介质。其中，该方法包括：生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典，其中，目标唤醒词为自定义唤醒词；基于唤醒词声学词典和唤醒词语言字典生成解码图；利用解码图对目标语音进行逐帧解码，得到语音识别结果。本发明解决了相关技术中进行语音识别的方式可靠性较低的技术问题。

2023-07-25

418KB

语音识别方法、装置、电子设备及可读存储介质.pdf

本发明提供一种语音识别方法、装置、电子设备及可读存储介质,其中方法包括:每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息;获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;对所述待识别语音数据包进行语音识别,得到本次的语音识别结果;确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备。本发明具有高及时性和高识别效率。

2023-04-19

948KB

语音识别方法、装置及计算机可读存储介质.pdf

本发明公开了一种语音识别方法，所述方法包括：侦听用户发出的语音信息；对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令；采集用户周围环境的背景音；根据预存的背景音模型对所述背景音进行识别，并根据识别结果确定用户所处位置；将所述语音指令和位置信息结合，形成最终识别结果并输出。本发明还同时公开了一种语音识别装置及计算机可读存储介质。本发明可提升智能终端设备的语音识别准确率。

2024-01-10

580KB

语音识别方法、装置、设备及计算机可读存储介质.pdf

本发明公开了一种语音识别方法、装置、设备及计算机可读存储介质，所述方法包括：将待识别语音数据从时域数据转换为第一时频图；将第一时频图输入目标卷积神经网络进行识别，得到待识别语音数据的第一分类结果；其中，目标卷积神经网络通过预先采用语音训练样本集训练得到。本发明中将待识别语音数据从一维的时域数据转换为二维的时频图，再采用卷积神经网络进行处理，提高了语音识别的准确率。

2023-07-22

439KB