人机交互方法、装置、设备以及存储介质.pdf
星星****眨眼
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
人机交互方法、装置、设备以及存储介质.pdf
本公开提供了人机交互方法、装置、设备以及存储介质,涉及深度学习、语音等人工智能领域。具体实现方案为:获取来自用户的目标语音指令以及用户的嘴部图像序列;对目标语音指令进行分析,确定对应的文本信息以及声学信息;对嘴部图像序列进行分析,确定嘴唇状态序列;基于文本信息、声学信息以及嘴唇状态序列,确定目标语音指令是否属于人机交互指令;响应于确定目标语音指令属于人机交互指令,对目标语音指令进行响应。本实现方式能够准确地判断用户的语音指令是否属于人机交互指令,能够提升智能设备指令执行的准确度,提升用户的交互体验。
人机交互及内容搜索方法、装置、设备以及存储介质.pdf
本公开提出了一种人机交互及内容搜索方法、装置、设备以及存储介质。识别当前轮次用户输入的指令中的意图信息所属的意图类别;基于当前轮次的意图类别,对上一轮次的类别组合进行更新,以得到当前轮次的类别组合;以及基于当前轮次的类别组合,确定当前轮次向用户反馈的内容。由此,本公开通过以用户的真实意图表达为线索,来设定交互流程,可以使得交互过程中用户的意图不会受到限制,并且用户的意图可以随时切换。
人机交互方法、装置、设备及存储介质.pdf
本申请提供了一种人机交互方法、装置、设备及存储介质,其中,该方法应用于人机交互设备,人机交互设备与机器人通信连接,通过在人机交互设备的处理器上执行软件应用并在人机交互设备的显示器上渲染得到图形用户界面,图形用户界面上显示有动作帧对应的控件,该方法包括:响应作用于初始控件的确定操作,检测用户在图形用户界面上的绘制轨迹,以初始控件为起点,将绘制轨迹经过的至少1个目标控件依次连接,获取各目标控件对应的动作帧的执行顺序。和现有技术相比,通过用户在图形用户界面上的绘制轨迹快捷地实现了动作帧和其执行顺序的编辑,操作简
人机交互方法、装置、设备及存储介质.pdf
本申请公开了一种人机交互方法、装置、设备及存储介质,涉及智能语音识别技术领域。该方法包括:从目标用户的图像中获取目标用户的面部信息,该面部信息包括目标用户的面部朝向以及嘴唇状态;根据目标用户的面部信息,确定是否对目标用户进行响应。本申请实施例的技术方案,不需要在每轮对话的开始通过唤醒词进行唤醒,从而能够实现数字人与目标用户的高效自然的交流。
扩音方法、装置、设备以及存储介质.pdf
本公开提供一种扩音方法、装置、设备以及存储介质,该方法包括:通过摄像头获取用户信息,将所述用户信息与预存识别信息进行比对,确定目标用户;响应于接收到所述目标用户发出的预设命令信息,确定所述目标用户所在区域的声音采集终端的工作状态;所述声音采集终端采集所述目标用户所在区域的声音信息,并将所述声音信息发送给声音处理终端;所述声音处理终端将所述声音信息与所述预存识别信息进行比对,从所述声音信息中提取所述目标用户的目标声音;将所述目标声音进行扩音并播放。本公开提供的扩音方法无需用户额外佩戴扩音设备,即可实现对用户