预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112530417A(43)申请公布日2021.03.19(21)申请号201910809985.5(22)申请日2019.08.29(71)申请人北京猎户星空科技有限公司地址100025北京市朝阳区姚家园南路一号惠通时代广场8号(72)发明人韩伟王阳阳李曙光(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人郭晓丽(51)Int.Cl.G10L15/197(2013.01)G10L15/18(2013.01)权利要求书2页说明书15页附图3页(54)发明名称语音信号处理方法、装置、电子设备及存储介质(57)摘要本发明涉及人工智能技术领域,公开了一种语音信号处理方法、装置、电子设备及存储介质,所述方法包括:对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;对临时识别结果进行分词处理,得到若干分词片段;获取第一分词序列之后的下一个分词片段为结束字符的预测概率,预测概率为根据词频数据确定的,词频数据包括基于语料库中的语料确定出的各分词序列在各语料中出现的次数,第一分词序列为临时识别结果中最后的N个分词片段组成的序列;若预测概率大于概率阈值,对临时识别结果进行语义解析。本发明实施例提供的技术方案,能够及时准确地对持续输入的音频流数据进行截断处理,缩短了智能设备的响应时间,提高用户体验。CN112530417ACN112530417A权利要求书1/2页1.一种语音信号处理方法,其特征在于,所述方法包括:对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;对所述临时识别结果进行分词处理,得到若干分词片段;获取第一分词序列之后的下一个分词片段为结束字符的预测概率,所述预测概率为根据所述词频数据确定的,所述词频数据包括基于语料库中的语料确定出的各分词序列在各语料中出现的次数,所述第一分词序列为所述临时识别结果中最后的N个分词片段组成的序列,N为正整数;若所述预测概率大于概率阈值,对所述临时识别结果进行语义解析。2.根据权利要求1所述的方法,其特征在于,所述获取第一分词序列之后的下一个分词片段为结束字符的预测概率,具体包括:从所述词频数据中获取所述第一分词序列对应的次数M;从所述词频数据中获取第二分词序列对应的次数K,所述第二分词序列为在所述第一分词序列之后增加所述结束字符得到的序列;根据所述K和所述M,确定所述预测概率;或者,从预先配置的各N元分词序列之后的下一个分词片段为结束字符的概率数据中,将所述第一分词序列对应的概率数据确定为预测概率,所述N元分词序列是基于所述语料库中的语料进行分词处理得到的,所述概率数据是根据所述N元分词序列对应的词频数据和在所述N元分词序列之后增加所述结束字符得到的N+1元分词序列对应的词频数据确定的。3.根据权利要求1或2所述的方法,其特征在于,通过如下方式获取所述词频数据:对所述语料库中的各语料进行分词处理,得到各语料对应的分词片段;将每个语料中连续的N个分词片段组成的序列确定为一个N元分词序列;将每个语料中连续的N+1个分词片段组成的序列确定为一个N+1元分词序列;统计每个所述N元分词序列和每个所述N+1元分词序列在所述语料库的各语料中出现的次数,得到所述词频数据。4.根据权利要求3所述的方法,其特征在于,通过以下方式更新所述语料库中的语料:若所述预测概率小于或等于所述概率阈值,且已检测到所述音频流数据中的语音起始点和语音结束点,在所述语音起始点和所述语音结束点之间的音频流数据对应的最终识别结果之后添加所述结束字符,将添加所述结束字符的最终识别结果作为新增的语料添加到所述语料库中;或者,获取人工干预后的具有完整语义的文本,在所述文本之后添加所述结束字符,将添加所述结束字符的文本作为新增的语料添加到所述语料库中。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述语料库中有新增的语料,对所述新增的语料进行分词处理,得到所述新增的语料对应的N元分词序列和N+1元分词序列;更新所述新增的语料对应的N元分词序列和N+1元分词序列对应的词频数据。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:若所述词频数据发生更新,根据更新后的词频数据,更新各分词序列对应的预测概率。7.根据权利要求1所述的方法,其特征在于,所述获取第一分词序列之后的下一个分词2CN112530417A权利要求书2/2页片段为结束字符的预测概率,具体包括:获取所述智能设备对应的专属词频数据,根据获取的专属词频数据,确定所述第一分词序列之后的下一个分词片段为结束字符的预测概率;和/或获取通用词频数据,根据所述通用词频数据,确定所述第一分词序列之后的下一个分词片段为结束字符的预测概率。8.一种语音信号处理装置,其特