预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113870861A(43)申请公布日2021.12.31(21)申请号202111065978.2(22)申请日2021.09.10(71)申请人OPPO广东移动通信有限公司地址523860广东省东莞市长安镇乌沙海滨路18号(72)发明人林浩智(74)专利代理机构北京恒博知识产权代理有限公司11528代理人范胜祥(51)Int.Cl.G10L17/02(2013.01)G10L17/14(2013.01)G10L17/22(2013.01)G06F40/35(2020.01)权利要求书2页说明书13页附图8页(54)发明名称语音交互方法、装置、存储介质及终端(57)摘要本公开提供一种语音交互方法、语音交互装置、计算机可读存储介质及终端,涉及语音技术领域。该方法包括:接收语音信息,并根据语音信息确定目标用户特征,以及根据语音信息确定槽位信息;根据目标用户特征,在预先设置的多个应答库中确定出至少一个目标应答库,其中,不同的用户特征对应于不同的应答库;根据槽位信息,在至少一个目标应答库中确定出对语音信息的应答内容;将目标应答内容确定为对所述语音信息的答复内容。本技术方案能够提高语音交互的多样性,有利于增加语音交互内容的个性化程度。CN113870861ACN113870861A权利要求书1/2页1.一种语音交互方法,其特征在于,所述方法包括:接收语音信息,并根据所述语音信息确定目标用户特征,以及根据所述语音信息确定槽位信息;根据所述目标用户特征,在预先设置的多个应答库中确定出至少一个目标应答库,其中,不同的用户特征对应于不同的应答库;根据所述槽位信息,在所述至少一个目标应答库中确定出目标应答内容;将所述目标应答内容确定为对所述语音信息的答复内容。2.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述语音信息确定槽位信息,包括:将所述语音信息转换为文本信息;将所述文本信息进行结构化处理得到所述槽位信息。3.根据权利要求2所述的语音交互方法,其特征在于,所述根据所述语音信息确定目标用户特征,包括:提取所述语音信息的第一类音频特征,并根据提取到的第一类音频特征对所述语音信息进行筛选;提取筛选后的语音信息的第二类音频特征,并根据所述第二类音频特征确定所述目标用户特征。4.根据权利要求3所述的语音交互方法,其特征在于,所述将所述语音信息转换为文本信息,包括:通过语音识别模块将所述语音信息转换为文本信息;所述提取所述语音信息的第一类音频特征,并根据提取到的第一类音频特征对所述语音信息进行筛选,包括:通过音频筛选模块提取所述语音信息的第一类音频特征,并根据提取到的第一类音频特征对所述语音信息进行筛选;其中,所述音频筛选模块与所述语音识别模块并行处理。5.根据权利要求3所述的语音交互方法,其特征在于,所述将所述文本信息进行结构化处理得到所述槽位信息,包括:通过自然语言理解模块将所述文本信息进行结构化处理得到所述槽位信息;所述提取筛选后的语音信息的第二类音频特征,并根据所述第二类音频特征确定所述目标用户特征,包括:通过特征检测模块提取筛选后的语音信息的第二类音频特征,并根据所述第二类音频特征确定所述目标用户特征;其中,所述特征检测模块与所述自然语言理解模块并行处理。6.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述语音信息确定目标用户特征,包括:提取所述语音信息的第二类音频特征;将提取到的第二类音频特征输入训练后的用户特征分类模型,其中,所述用户特征分类模型用于根据输入音频特征预测用户的年龄段和/或用户的性别;根据所述用户特征分类模型的输出确定所述目标用户特征。7.根据权利要求1所述的语音交互方法,其特征在于,在所述根据所述语音信息确定目标用户特征之前,所述方法还包括:2CN113870861A权利要求书2/2页提取所述语音信息的第一类音频特征;将提取到的第一类音频特征输入训练后的音频质量分类模型;根据所述音频质量分类模型的输出对所述语音信息进行筛选,以通过筛选后的语音信息确定所述目标用户特征。8.根据权利要求1所述的语音交互方法,其特征在于,所述用户特征包括:N个年龄段分别对应的用户特征,以及第一性别和第二性别;所述方法还包括:确定针对第i个年龄段的第i应答库,并将所述第i年龄段的用户特征与所述第i应答库关联,i为不大于N的正整数,N为正整数;确定针对第一性别的第N+1应答库,并将所述第一性别的用户特征与所述第N+1应答库关联;确定针对第二性别的第N+2应答库,并将所述第二性别的用户特征与所述第N+2应答库关联,得到预先设置的多个应答库。9.根据权利要求3所述的语音交互方法,其特征在于,所述第一类音频特征包括预设类型的静态特征,所述第二类音频特征包括