人机交互方法、装置、设备及存储介质-豆柴文库

人机交互方法、装置、设备及存储介质.pdf

2023-08-26

10金币

610KB

17页

白真****ng

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共17页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111443801A(43)申请公布日2020.07.24(21)申请号202010220089.8(22)申请日2020.03.25(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人李扬李士岩(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人张娜臧建明(51)Int.Cl.G06F3/01(2006.01)G06K9/00(2006.01)G10L15/22(2006.01)权利要求书2页说明书10页附图4页(54)发明名称人机交互方法、装置、设备及存储介质(57)摘要本申请公开了一种人机交互方法、装置、设备及存储介质，涉及智能语音识别技术领域。该方法包括：从目标用户的图像中获取目标用户的面部信息，该面部信息包括目标用户的面部朝向以及嘴唇状态；根据目标用户的面部信息，确定是否对目标用户进行响应。本申请实施例的技术方案，不需要在每轮对话的开始通过唤醒词进行唤醒，从而能够实现数字人与目标用户的高效自然的交流。CN111443801ACN111443801A权利要求书1/2页1.一种人机交互方法，其特征在于，包括：从目标用户的图像中获取所述目标用户的面部信息，所述面部信息包括所述目标用户的面部朝向以及嘴唇状态；根据所述目标用户的面部信息，确定是否对所述目标用户进行响应。2.根据权利要求1所述的方法，其特征在于，所述根据所述目标用户的面部信息，确定是否对所述目标用户进行响应，包括：根据所述目标用户的面部信息，确定所述目标用户的所述面部朝向以及所述嘴唇状态；若所述面部朝向的方向为预定方向，并且所述嘴唇状态为唇动状态，则确定对所述目标用户进行响应。3.根据权利要求2所述的方法，其特征在于，所述预定方向为虚拟对象的正面方向，所述对所述目标用户进行响应，包括：通过所述虚拟对象对所述目标用户进行响应。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：从所述目标用户的图像中获取所述目标用户的当前状态，所述当前状态包括：所述目标用户的动作、表情、环境中的一种或多种；根据所述当前状态，对所述目标用户进行响应。5.根据权利要求4所述的方法，其特征在于，所述根据所述当前状态，对所述目标用户进行响应，包括：根据所述目标用户的当前状态，确定对所述目标用户的反馈优先级；基于所述反馈优先级，对所述目标用户进行响应。6.根据权利要求4所述的方法，其特征在于，所述对所述目标用户进行响应，包括：获取所述目标用户的语音信息；根据所述当前状态和所述语音信息，通过虚拟对象对所述目标用户进行反馈操作，所述反馈操作包括语音反馈、动作反馈以及表情反馈中的一种或多种。7.根据权利要求4所述的方法，其特征在于，所述对所述目标用户进行响应，包括：获取所述目标用户的语音信息；根据所述当前状态以及所述语音信息，调用第三方应用程序对所述目标用户进行响应。8.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：若确定对所述目标用户进行响应，则获取所述目标用户发出的语音信息；基于所述语音信息，对所述目标用户进行语音反馈。9.根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：接收所述目标用户通过图形用户界面输入的交互指令，根据所述交互指令对所述目标用户进行反馈。10.一种人机交互装置，其特征在于，包括：信息获取模块，用于从目标用户的图像中获取所述目标用户的面部信息，所述面部信息包括所述目标用户的面部朝向以及嘴唇状态；响应判断模块，用于根据所述目标用户的面部信息，确定是否对所述目标用户进行响2CN111443801A权利要求书2/2页应。11.根据权利要求10所述的装置，其特征在于，所述响应判断模块包括：信息确定单元，用于根据所述目标用户的面部信息，确定所述目标用户的所述面部朝向以及所述嘴唇状态；响应确定单元，用于若所述面部朝向的方向为预定方向，并且所述嘴唇状态为唇动状态，则确定对所述目标用户进行响应。12.根据权利要求11所述的装置，其特征在于，所述预定方向为虚拟对象的正面方向，所述响应判断模块具体还用于：通过所述虚拟对象对所述目标用户进行响应。13.根据权利要求10所述的装置，其特征在于，所述装置还包括：状态获取模块，用于从所述目标用户的图像中获取所述目标用户的当前状态，所述当前状态包括：所述目标用户的动作、表情、环境中的一种或多种；第一响应模块，用于根据所述当前状态，对所述目标用户进行响应。14.根据权利要求13所述的装置，其特征在于，所述第一响应模块具体还用于：根据所述目标用户的当前状态，确定对所述目标用户的反馈优先级；基于所述反馈优先级，对所述目标用户进行响应。15.根据权利要求13所述的装置，其特征

相关资料

人机交互方法、装置、设备及存储介质.pdf

本申请公开了一种人机交互方法、装置、设备及存储介质，涉及智能语音识别技术领域。该方法包括：从目标用户的图像中获取目标用户的面部信息，该面部信息包括目标用户的面部朝向以及嘴唇状态；根据目标用户的面部信息，确定是否对目标用户进行响应。本申请实施例的技术方案，不需要在每轮对话的开始通过唤醒词进行唤醒，从而能够实现数字人与目标用户的高效自然的交流。

2023-08-26

610KB

人机交互方法、装置、设备及存储介质.pdf

本申请提供了一种人机交互方法、装置、设备及存储介质，其中，该方法应用于人机交互设备，人机交互设备与机器人通信连接，通过在人机交互设备的处理器上执行软件应用并在人机交互设备的显示器上渲染得到图形用户界面，图形用户界面上显示有动作帧对应的控件，该方法包括：响应作用于初始控件的确定操作，检测用户在图形用户界面上的绘制轨迹，以初始控件为起点，将绘制轨迹经过的至少1个目标控件依次连接，获取各目标控件对应的动作帧的执行顺序。和现有技术相比，通过用户在图形用户界面上的绘制轨迹快捷地实现了动作帧和其执行顺序的编辑，操作简

2023-12-03

940KB

人机交互方法、装置、设备以及存储介质.pdf

本公开提供了人机交互方法、装置、设备以及存储介质，涉及深度学习、语音等人工智能领域。具体实现方案为：获取来自用户的目标语音指令以及用户的嘴部图像序列；对目标语音指令进行分析，确定对应的文本信息以及声学信息；对嘴部图像序列进行分析，确定嘴唇状态序列；基于文本信息、声学信息以及嘴唇状态序列，确定目标语音指令是否属于人机交互指令；响应于确定目标语音指令属于人机交互指令，对目标语音指令进行响应。本实现方式能够准确地判断用户的语音指令是否属于人机交互指令，能够提升智能设备指令执行的准确度，提升用户的交互体验。

2023-07-25

695KB

人机交互方法、装置和存储介质.pdf

本申请公开了一种人机交互方法、装置和存储介质，涉及人机交互领域。本申请中，引入了指令词闲聊功能。让用户进行人机交互时需要携带该指令词，这样，若确定该语音信息中包括指令词，则能够确定该语音信息是针对智能设备发出的，从而使智能设备对该语音信息进行响应。由此，使智能设备具有分辨接收到的语音是针对自己的还是外人的能力，而不会针对每条接收到的语音都作出响应，避免乱插话、哇哇乱叫的同时，还能够因为减少不必要的响应节约处理资源和电能。

2024-01-04

520KB

人机交互及内容搜索方法、装置、设备以及存储介质.pdf

本公开提出了一种人机交互及内容搜索方法、装置、设备以及存储介质。识别当前轮次用户输入的指令中的意图信息所属的意图类别；基于当前轮次的意图类别，对上一轮次的类别组合进行更新，以得到当前轮次的类别组合；以及基于当前轮次的类别组合，确定当前轮次向用户反馈的内容。由此，本公开通过以用户的真实意图表达为线索，来设定交互流程，可以使得交互过程中用户的意图不会受到限制，并且用户的意图可以随时切换。

2023-08-27

709KB