语音交互方法、装置、存储介质及终端-豆柴文库

语音交互方法、装置、存储介质及终端.pdf

2023-07-25

10金币

1.2MB

24页

An****99

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共24页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113870861A(43)申请公布日2021.12.31(21)申请号202111065978.2(22)申请日2021.09.10(71)申请人OPPO广东移动通信有限公司地址523860广东省东莞市长安镇乌沙海滨路18号(72)发明人林浩智(74)专利代理机构北京恒博知识产权代理有限公司11528代理人范胜祥(51)Int.Cl.G10L17/02(2013.01)G10L17/14(2013.01)G10L17/22(2013.01)G06F40/35(2020.01)权利要求书2页说明书13页附图8页(54)发明名称语音交互方法、装置、存储介质及终端(57)摘要本公开提供一种语音交互方法、语音交互装置、计算机可读存储介质及终端，涉及语音技术领域。该方法包括：接收语音信息，并根据语音信息确定目标用户特征，以及根据语音信息确定槽位信息；根据目标用户特征，在预先设置的多个应答库中确定出至少一个目标应答库，其中，不同的用户特征对应于不同的应答库；根据槽位信息，在至少一个目标应答库中确定出对语音信息的应答内容；将目标应答内容确定为对所述语音信息的答复内容。本技术方案能够提高语音交互的多样性，有利于增加语音交互内容的个性化程度。CN113870861ACN113870861A权利要求书1/2页1.一种语音交互方法，其特征在于，所述方法包括：接收语音信息，并根据所述语音信息确定目标用户特征，以及根据所述语音信息确定槽位信息；根据所述目标用户特征，在预先设置的多个应答库中确定出至少一个目标应答库，其中，不同的用户特征对应于不同的应答库；根据所述槽位信息，在所述至少一个目标应答库中确定出目标应答内容；将所述目标应答内容确定为对所述语音信息的答复内容。2.根据权利要求1所述的语音交互方法，其特征在于，所述根据所述语音信息确定槽位信息，包括：将所述语音信息转换为文本信息；将所述文本信息进行结构化处理得到所述槽位信息。3.根据权利要求2所述的语音交互方法，其特征在于，所述根据所述语音信息确定目标用户特征，包括：提取所述语音信息的第一类音频特征，并根据提取到的第一类音频特征对所述语音信息进行筛选；提取筛选后的语音信息的第二类音频特征，并根据所述第二类音频特征确定所述目标用户特征。4.根据权利要求3所述的语音交互方法，其特征在于，所述将所述语音信息转换为文本信息，包括：通过语音识别模块将所述语音信息转换为文本信息；所述提取所述语音信息的第一类音频特征，并根据提取到的第一类音频特征对所述语音信息进行筛选，包括：通过音频筛选模块提取所述语音信息的第一类音频特征，并根据提取到的第一类音频特征对所述语音信息进行筛选；其中，所述音频筛选模块与所述语音识别模块并行处理。5.根据权利要求3所述的语音交互方法，其特征在于，所述将所述文本信息进行结构化处理得到所述槽位信息，包括：通过自然语言理解模块将所述文本信息进行结构化处理得到所述槽位信息；所述提取筛选后的语音信息的第二类音频特征，并根据所述第二类音频特征确定所述目标用户特征，包括：通过特征检测模块提取筛选后的语音信息的第二类音频特征，并根据所述第二类音频特征确定所述目标用户特征；其中，所述特征检测模块与所述自然语言理解模块并行处理。6.根据权利要求1所述的语音交互方法，其特征在于，所述根据所述语音信息确定目标用户特征，包括：提取所述语音信息的第二类音频特征；将提取到的第二类音频特征输入训练后的用户特征分类模型，其中，所述用户特征分类模型用于根据输入音频特征预测用户的年龄段和/或用户的性别；根据所述用户特征分类模型的输出确定所述目标用户特征。7.根据权利要求1所述的语音交互方法，其特征在于，在所述根据所述语音信息确定目标用户特征之前，所述方法还包括：2CN113870861A权利要求书2/2页提取所述语音信息的第一类音频特征；将提取到的第一类音频特征输入训练后的音频质量分类模型；根据所述音频质量分类模型的输出对所述语音信息进行筛选，以通过筛选后的语音信息确定所述目标用户特征。8.根据权利要求1所述的语音交互方法，其特征在于，所述用户特征包括：N个年龄段分别对应的用户特征，以及第一性别和第二性别；所述方法还包括：确定针对第i个年龄段的第i应答库，并将所述第i年龄段的用户特征与所述第i应答库关联，i为不大于N的正整数，N为正整数；确定针对第一性别的第N+1应答库，并将所述第一性别的用户特征与所述第N+1应答库关联；确定针对第二性别的第N+2应答库，并将所述第二性别的用户特征与所述第N+2应答库关联，得到预先设置的多个应答库。9.根据权利要求3所述的语音交互方法，其特征在于，所述第一类音频特征包括预设类型的静态特征，所述第二类音频特征包括

相关资料

语音交互方法、装置、存储介质及终端.pdf

本公开提供一种语音交互方法、语音交互装置、计算机可读存储介质及终端，涉及语音技术领域。该方法包括：接收语音信息，并根据语音信息确定目标用户特征，以及根据语音信息确定槽位信息；根据目标用户特征，在预先设置的多个应答库中确定出至少一个目标应答库，其中，不同的用户特征对应于不同的应答库；根据槽位信息，在至少一个目标应答库中确定出对语音信息的应答内容；将目标应答内容确定为对所述语音信息的答复内容。本技术方案能够提高语音交互的多样性，有利于增加语音交互内容的个性化程度。

2023-07-25

1.2MB

语音交互方法、装置、终端设备、存储介质及程序产品.pdf

本申请实施例提供了一种语音交互方法、装置、终端设备、存储介质及程序产品。该方法通过获取用户输入的用户语音，然后，根据用户语音对应的信息以及终端设备的当前工作状态，确定用于响应用户语音的反馈指令，从而根据反馈指令将终端设备自动从当前工作状态切换至另一工作状态，和/或，执行反馈指令对应的目标动作，和/或，执行对话交流，从而通过结合用户语音识别结果与当前工作状态这两个维度联合确定结果的方式，可以使得终端设备在与用户进行语音交互时，能够更加智能、方便、顺畅。

2023-07-25

688KB

语音交互方法、系统、终端及存储介质.pdf

本申请提供了一种语音交互方法、系统、终端及存储介质，通过采集用户输入的第N轮语音数据，N为正整数；识别所述第N轮语音数据，生成一个第N关键词；从N个关键词中选取M个关键词；所述N个关键词为N轮语音数据中的关键词，M为小于或等于N的正整数；从内容库中获取与所述M个关键词匹配的至少一个输出结果。当用户对智能语音终端下达指令时，简短的关键词指令下达方式可在瞬间完成，很多程度上降低了用户在使用语音智能设备的不适应感，且每次在指令下达后，智能设备即重新反馈内容给用户，语音交互的效率大大提高。

2023-08-30

761KB

语音交互方法、装置、设备及存储介质.pdf

本公开涉及一种语音交互方法、装置、设备及存储介质。本公开通过跳绳设备获取所述语音采集模块采集到的第一用户语音，并对所述第一用户语音进行语音识别，得到所述第一用户语音对应的第一文本，若所述第一文本中包括目标关键词，则控制所述跳绳设备进入工作状态。进一步，跳绳设备获取所述语音采集模块采集到的第二用户语音，并对所述第二用户语音进行语音识别，得到所述第二用户语音对应的第二文本，执行所述第二文本对应的指令，并生成指令执行结果，进一步还可以通过所述语音播放模块播放所述指令执行结果。使得用户可以通过语音交互方式与跳绳设

2023-07-24

912KB

语音交互方法、装置及可读存储介质.pdf

本申请提供了一种语音交互方法、装置及可读存储介质，涉及计算机技术领域。该方法应用于与语音处理设备基于9P协议通信的语音交互设备，语音交互设备与语音处理设备的文件系统的文件目录相同，该方法包括：将接收到的语音流对应的目标语音数据写入到语音处理设备的第一目标文件中；在第二目标文件被语音处理设备写入目标语音数据对应的目标处理结果的情况下，从第二目标文件中读取目标处理结果，并执行与目标处理结果对应的目标操作。如此，通过采用9P协议作为底层协议架构，以统一的文件接口形式进行语音处理设备和语音交互设备的语音交互，可简

2023-07-24

966KB