预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113889093A(43)申请公布日2022.01.04(21)申请号202111292450.9(22)申请日2021.11.03(71)申请人上海喜马拉雅科技有限公司地址201100上海市闵行区紫星路588号2幢2062室(72)发明人吕翔卢恒印晶晶(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人张欣欣(51)Int.Cl.G10L15/06(2013.01)G10L15/22(2006.01)G10L15/26(2006.01)权利要求书2页说明书9页附图8页(54)发明名称语音识别方法、电子设备及计算机可读存储介质(57)摘要本发明实施方式提出一种语音识别方法、电子设备及计算机可读存储介质,属于语音识别的领域,方法包括:将待识别语音进行转文字处理,在每个时间步识别出多个识别词和各识别词的后验概率,将每个时间步的各识别词与前后两个时间步的所有识别词一一组合,得到多条解码路径,并针对每条解码路径,遍历字典树,查看该解码路径上的所有识别词是否与字典树上的热词匹配,以得到匹配结果,从而根据各识别词的后验概率及匹配结果,得到每条解码路径的置信分数,进而根据置信分数,从各条解码路径中确定目标词句,采用字典树进行热词匹配,没有对fst组件的依赖,降低热词功能的算法复杂度,以更快地识别热词,进而提高语音识别的速度和准确性。CN113889093ACN113889093A权利要求书1/2页1.一种语音识别方法,其特征在于,所述方法包括:将待识别语音进行转文字处理,得到在每个时间步识别出的多个识别词和各识别词的后验概率;将每个所述时间步的各所述识别词与前后两个所述时间步的所有识别词一一组合,得到多条解码路径;针对每条解码路径,遍历预设的字典树,查看该解码路径上的所有识别词是否与所述字典树上的热词匹配,以得到匹配结果;其中,所述字典树包括根节点、多个子节点及多个叶子节点,从根节点到一个叶子节点组成一个热词;根据各所述识别词的所述后验概率以及所述匹配结果,得到每条所述解码路径的置信分数,根据所述置信分数,从各条所述解码路径中确定目标词句。2.根据权利要求1所述的语音识别方法,其特征在于,所述方法还包括构建字典树的步骤,该步骤包括:基于解码词典,以最细粒度对热词表上的各热词进行分词,得到各热词的分词结果,所述分词结果包括多个有序的基本词;设置根节点,将第一个所述热词的第一个基本词作为所述根节点的子节点,将该热词剩余每个所述基本词作为该基本词之前的基本词的子节点,最后一个基本词作为叶子节点;对于剩余每个所述热词的第一个所述基本词,查询该基本词是否与所述根节点的至少一个子节点相同,若否,则创建新的子节点,并基于该子节点和剩余所述基本词,创建该子节点之后的子节点;否则,基于所述根节点的该子节点和剩余所述基本词,创建后续子节点;直至处理完所有所述热词,得到字典树。3.根据权利要求1或2所述的语音识别方法,其特征在于,在所述得到匹配结果的步骤之后,在所述根据各所述识别词的所述后验概率以及所述匹配结果,得到每条所述解码路径的置信分数的步骤之前,所述方法还包括:给所述匹配结果为成功的每条所述解码路径增加预设的概率值。4.根据权利要求3所述的语音识别方法,其特征在于,所述根据各所述识别词的所述后验概率以及所述匹配结果,得到每条所述解码路径的置信分数的步骤,包括:将每条所述解码路径上各所述识别词的所述后验概率相加,并加上所述概率值,得到各条所述解码路径的置信分数;其中,所述匹配结果为失败的解码路径的概率值小于所述匹配结果为成功的解码路径的概率值。5.根据权利要求1或2所述的语音识别方法,其特征在于,在所述得到在每个时间步识别出的多个识别词和各识别词的后验概率的步骤之后,在所述将每个所述时间步的各所述识别词与前后两个所述时间步的所有识别词一一组合的步骤之前,所述方法还包括:分别将各所述识别词的后验概率与阈值进行比较,并剔除所述后验概率小于阈值的识别词。6.根据权利要求1或2所述的语音识别方法,其特征在于,所述针对每条解码路径,遍历预设的字典树,查看该解码路径上的所有词是否与所述字典树上的热词匹配的步骤,包括:2CN113889093A权利要求书2/2页针对每条所述解码路径,若该解码路径的第一个识别词至最后一个识别词,与所述字典树的所述根节点的至少一个子节点到至少一个叶子节点组成的热词对应,则该解码路径与所述字典树上的热词匹配,否则该解码路径与所述字典树上的热词不匹配。7.根据权利要求1所述的语音识别方法,其特征在于,所述将待识别语音进行转文字处理,得到在每个时间步识别出的多个识别词和识别词的后验概率的步骤,包括:将待识别语音输入预设的神经网络,每间隔一个时