预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110288985A(43)申请公布日2019.09.27(21)申请号201910580527.9(22)申请日2019.06.28(71)申请人北京猎户星空科技有限公司地址100025北京市朝阳区姚家园南路一号惠通时代广场8号(72)发明人李思达韩伟(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人黄志华(51)Int.Cl.G10L15/18(2013.01)G10L15/26(2006.01)G10L25/12(2013.01)G06F17/27(2006.01)权利要求书2页说明书14页附图3页(54)发明名称语音数据处理方法、装置、电子设备及存储介质(57)摘要本发明涉及人工智能技术领域信息,公开了一种语音数据处理方法、装置、电子设备及存储介质,所述方法包括:对智能设备实时采集到的语音数据进行语音识别,得到语音识别结果;根据所述语音识别结果和当前对话的语境信息,从预设语料库中,确定所述语音识别结果对应的预测文本。本发明实施例提供的技术方案,通过在语音数据处理过程中引入当前对话对应的语境信息,实现随着交互环境的变化动态调整语音识别结果对应的预测文本,提高语音数据处理的准确率。CN110288985ACN110288985A权利要求书1/2页1.一种语音数据处理方法,其特征在于,包括:对智能设备实时采集到的语音数据进行语音识别,得到语音识别结果;根据所述语音识别结果和当前对话的语境信息,从预设语料库中,确定所述语音识别结果对应的预测文本。2.根据权利要求1所述的方法,其特征在于,根据所述语音识别结果和当前对话的语境信息,从预设语料库中,确定所述语音识别结果对应的预测文本,具体包括:从语料库中选取与所述语音识别结果的匹配度高于预设阈值的语料,确定为候选文本;基于当前对话的语境信息,从所述候选文本中确定出所述语音识别结果对应的预测文本。3.根据权利要求2所述的方法,其特征在于,所述基于当前对话的语境信息,从所述候选文本中确定出所述语音识别结果对应的预测文本,具体包括:若基于当前对话的语境信息确定出至少一个命名实体,将包含所述命名实体的候选文本确定为所述语音识别结果对应的预测文本。4.根据权利要求3所述的方法,其特征在于,所述将包含所述命名实体的候选文本确定为所述语音识别结果对应的预测文本,具体包括:若基于当前对话的语境信息确定出多个命名实体,将包含所述命名实体的数量最多的候选文本确定为所述语音识别结果对应的预测文本。5.根据权利要求1至4中任一所述的方法,其特征在于,确定所述语音识别结果对应的预测文本之后,还包括:基于所述语境信息确定出至少一个第一命名实体;确定出所述预测文本中包含的至少一个第二命名实体;计算所述第一命名实体和所述第二命名实体的相似度;若所述第一命名实体和所述第二命名实体的相似度大于相似度阈值,将所述预测文本中的所述第二命名实体替换为所述第一命名实体。6.根据权利要求1至4中任一所述的方法,其特征在于,还包括:基于以下至少一种信息确定所述语境信息:所述智能设备当前展示的内容、所述智能设备采集到的信息、以及所述智能设备当前的状态信息。7.根据权利要求1至4中任一所述的方法,其特征在于,确定所述语音识别结果对应的预测文本之后,还包括:根据所述预测文本和所述语境信息,确定所述预测文本的最终语义识别结果;根据所述预测文本的最终语义识别结果,确定所述预测文本对应的响应数据。8.一种语音数据处理装置,其特征在于,包括:语音识别模块,用于对智能设备实时采集到的语音数据进行语音识别,得到语音识别结果;预测模块,用于根据所述语音识别结果和当前对话的语境信息,从预设语料库中,确定所述语音识别结果对应的预测文本。9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方2CN110288985A权利要求书2/2页法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该计算机程序指令被处理器执行时实现权利要求1至7任一项所述方法的步骤。3CN110288985A说明书1/14页语音数据处理方法、装置、电子设备及存储介质技术领域[0001]本发明涉及人工智能技术领域,尤其涉及一种语音数据处理方法、装置、电子设备及存储介质。背景技术[0002]随着科学技术的迅猛发展,智能设备已经拥有了强大的处理能力,使得智能设备在一定程度上能够像人类一样理解自然语言,从而实现了人机交互。自然语言处理过程中一个重要的环节是语义识别,现有的语义识别方法通常是基于固定的语料库实现的,即基于用户输入的语音数据对应的语音识别结果,从语料库中获取对