语音交互方法、系统、终端设备及存储介质-豆柴文库

语音交互方法、系统、终端设备及存储介质.pdf

2024-01-06

10金币

567KB

15页

诗文****仙女

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共15页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115019788A(43)申请公布日2022.09.06(21)申请号202210404699.2(22)申请日2022.04.18(71)申请人厦门快商通科技股份有限公司地址361009福建省厦门市集美区软件园三期诚毅北大街63号1301单元(72)发明人刘焕玉肖龙源李稀敏叶志坚(74)专利代理机构厦门仕诚联合知识产权代理事务所(普通合伙)35227专利代理师戴惠恋(51)Int.Cl.G10L15/22(2006.01)G10L15/06(2013.01)G10L25/03(2013.01)G10L25/51(2013.01)G10L25/63(2013.01)权利要求书2页说明书9页附图3页(54)发明名称语音交互方法、系统、终端设备及存储介质(57)摘要本发明提供了一种语音交互方法、系统、终端设备及存储介质，该方法包括：对用户进行语音采集，得到待交互语音，并对所述待交互语音进行属性分析，得到语音属性信息，所述语音属性信息包括年龄、性别和情绪中一种或多种的组合；根据所述语音属性信息确定应答属性信息，并对所述待交互语音进行应答分析，得到应答语音；根据所述应答属性信息对所述应答语音进行语音渲染，得到输出语音，并根据所述输出语音对所述用户进行语音交互。本发明通过将应答属性信息对应答语音进行语音渲染，使得针对不同年龄、性别和/或情绪的用户，能对应进行不同语音状态的应答，提高了语音交互的多样性，进而提高了用户的交互体验。CN115019788ACN115019788A权利要求书1/2页1.一种语音交互方法，其特征在于，所述方法包括：对用户进行语音采集，得到待交互语音，并对所述待交互语音进行属性分析，得到语音属性信息，所述语音属性信息包括年龄、性别和情绪中一种或多种的组合；根据所述语音属性信息确定应答属性信息，并对所述待交互语音进行应答分析，得到应答语音；根据所述应答属性信息对所述应答语音进行语音渲染，得到输出语音，并根据所述输出语音对所述用户进行语音交互。2.如权利要求1所述的语音交互方法，其特征在于，所述对所述待交互语音进行属性分析，得到语音属性信息，包括：获取模型训练样本，并对所述模型训练样本分别进行年龄、性别和情绪的标注，得到年龄标注信息、性别标注信息和情绪标注信息；根据所述年龄标注信息对年龄段识别模型进行模型训练，直至所述年龄段识别模型收敛；根据所述性别标注信息对性别识别模型进行模型训练，直至所述性别识别模型收敛；根据所述情绪标注信息对情绪识别模型进行模型训练，直至所述情绪识别模型收敛；根据收敛后的所述年龄段识别模型、所述性别识别模型和所述情绪识别模型分别对所述待交互语音进行分析，得到用户年龄、用户性别和用户情绪；其中，所述语音属性信息包括所述用户年龄、所述用户性别和所述用户情绪。3.如权利要求1所述的语音交互方法，其特征在于，所述根据所述语音属性信息确定应答属性信息，包括：将所述用户年龄、所述用户性别和所述用户情绪分别与预存储的属性查询表进行匹配，得到应答年龄、应答性别和应答情绪；其中，所述应答属性信息包括所述应答年龄、所述应答性别和所述应答情绪，所述属性查询表中存储有不同用户年龄与对应应答年龄之间的对应关系，存储有不同性别与对应应答性别之间的对应关系，存储有不同用户情绪与对应应答情绪之间的对应关系。4.如权利要求2所述的语音交互方法，其特征在于，所述对所述待交互语音进行属性分析，得到语音属性信息之后，还包括：分别将所述用户年龄、所述用户性别和所述用户情绪进行组合，得到属性组集合；若所述属性组集合中任一属性组是预设属性组合，则将所述预设属性组合对应的情景应答属性设置为所述应答属性信息。5.如权利要求2所述的语音交互方法，其特征在于，所述对所述待交互语音进行属性分析，得到语音属性信息之前，还包括：对所述用户的当前所处环境进行信息采集，得到环境信息，并提取所述环境信息的特征，得到当前环境特征，所述环境信息包括环境图像、环境语音、环境坐标中一种或多种的组合；将所述用户情绪和所述当前环境特征与预设环境特征进行匹配；若所述用户情绪和所述当前环境特征与所述预设环境特征的匹配合格，则将所述预设环境特征对应的环境应答属性设置为所述应答属性信息。6.如权利要求1所述的语音交互方法，其特征在于，所述方法还包括：2CN115019788A权利要求书2/2页对所述待交互语音进行实体分析，得到语音实体，并将所述语音实体与预存储的隐私词汇表进行匹配，所述隐私词汇表中存储有所述用户预设置的隐私词汇；若所述语音实体与所述隐私词汇表匹配成功，则对所述用户的当前所处环境进行信息采集，得到环境信息，并对所述环境信息进行隐私检测，所述隐私检测用户判断所述用户当前所处环境是否为安全环境；若检测到所

相关资料

语音交互方法、系统、终端设备及存储介质.pdf

本发明提供了一种语音交互方法、系统、终端设备及存储介质，该方法包括：对用户进行语音采集，得到待交互语音，并对所述待交互语音进行属性分析，得到语音属性信息，所述语音属性信息包括年龄、性别和情绪中一种或多种的组合；根据所述语音属性信息确定应答属性信息，并对所述待交互语音进行应答分析，得到应答语音；根据所述应答属性信息对所述应答语音进行语音渲染，得到输出语音，并根据所述输出语音对所述用户进行语音交互。本发明通过将应答属性信息对应答语音进行语音渲染，使得针对不同年龄、性别和/或情绪的用户，能对应进行不同语音状态的

2024-01-06

567KB

语音交互方法、系统、终端及存储介质.pdf

本申请提供了一种语音交互方法、系统、终端及存储介质，通过采集用户输入的第N轮语音数据，N为正整数；识别所述第N轮语音数据，生成一个第N关键词；从N个关键词中选取M个关键词；所述N个关键词为N轮语音数据中的关键词，M为小于或等于N的正整数；从内容库中获取与所述M个关键词匹配的至少一个输出结果。当用户对智能语音终端下达指令时，简短的关键词指令下达方式可在瞬间完成，很多程度上降低了用户在使用语音智能设备的不适应感，且每次在指令下达后，智能设备即重新反馈内容给用户，语音交互的效率大大提高。

2023-08-30

761KB

语音交互方法、装置、终端设备、存储介质及程序产品.pdf

本申请实施例提供了一种语音交互方法、装置、终端设备、存储介质及程序产品。该方法通过获取用户输入的用户语音，然后，根据用户语音对应的信息以及终端设备的当前工作状态，确定用于响应用户语音的反馈指令，从而根据反馈指令将终端设备自动从当前工作状态切换至另一工作状态，和/或，执行反馈指令对应的目标动作，和/或，执行对话交流，从而通过结合用户语音识别结果与当前工作状态这两个维度联合确定结果的方式，可以使得终端设备在与用户进行语音交互时，能够更加智能、方便、顺畅。

2023-07-25

688KB

交互控制方法、终端设备及存储介质.pdf

本发明公开了一种交互控制方法，包括以下步骤：获取用户的肢体图像数据；确定所述肢体图像数据与历史肢体图像数据之间的相似度，其中，所述历史肢体图像数据为所述终端设备保存的肢体图像数据；在所述相似度满足预设条件时，根据所述历史肢体图像数据确定所述用户的肢体对应的三维模型；根据所述三维模型，在显示画面中渲染所述用户肢体的三维图像，以基于所述包含所述三维图像的显示画面进行交互控制。本发明还公开了一种终端设备及计算机可读存储介质，达成了提升HMD人机交互的方案的便捷性的效果。

2024-01-06

813KB

语音交互方法、装置及可读存储介质.pdf

本申请提供了一种语音交互方法、装置及可读存储介质，涉及计算机技术领域。该方法应用于与语音处理设备基于9P协议通信的语音交互设备，语音交互设备与语音处理设备的文件系统的文件目录相同，该方法包括：将接收到的语音流对应的目标语音数据写入到语音处理设备的第一目标文件中；在第二目标文件被语音处理设备写入目标语音数据对应的目标处理结果的情况下，从第二目标文件中读取目标处理结果，并执行与目标处理结果对应的目标操作。如此，通过采用9P协议作为底层协议架构，以统一的文件接口形式进行语音处理设备和语音交互设备的语音交互，可简

2023-07-24

966KB