语音交互装置和方法-豆柴文库

语音交互装置和方法.pdf

2023-06-10

10金币

996KB

23页

康平****ng

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共23页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106373569A(43)申请公布日2017.02.01(21)申请号201610806384.5G10L13/08(2013.01)(22)申请日2016.09.06G06K9/00(2006.01)(71)申请人北京地平线机器人技术研发有限公司地址100085北京市海淀区上地信息路1号（北京实创高科技发展总公司1-1号，1-2号）1-1幢2层A栋02-114号(72)发明人曹立新(74)专利代理机构北京市正见永申律师事务所11497代理人黄小临冯玉清(51)Int.Cl.G10L15/22(2006.01)G10L15/26(2006.01)G10L15/08(2006.01)权利要求书3页说明书12页附图7页(54)发明名称语音交互装置和方法(57)摘要本申请涉及语音交互装置和方法。在一示例性实施例中，一种语音交互方法可包括：接收来自人类用户的第一语音输入和与所述第一语音输入相关联的第一表情图像输入；识别所述第一语音输入的第一语义；识别所述第一表情图像输入的第一表情；基于所述第一语义和所述第一表情确定与所述第一语义相关联的第一置信度；以及基于所述第一语义和所述第一置信度来生成第一响应信息。通过利用表情和语义来产生响应信息，该方法可以改善人机语音交互过程中人类用户的体验。CN106373569ACN106373569A权利要求书1/3页1.一种语音交互方法，包括：接收来自人类用户的第一语音输入和与所述第一语音输入相关联的第一表情图像输入；识别所述第一语音输入的第一语义；识别所述第一表情图像输入的第一表情；基于所述第一语义和所述第一表情确定与所述第一语义相关联的第一置信度；以及基于所述第一语义和所述第一置信度来生成第一响应信息。2.如权利要求1所述的方法，其中，确定与所述第一语义相关联的第一置信度包括：为所述第一语义分配一默认置信度；以及基于所述第一表情来调整所述默认置信度，包括：当所述第一表情是肯定性表情时，增大所述默认置信度；当所述第一表情是否定性表情时，减小所述默认置信度；以及当所述第一表情是除了所述肯定性表情和所述否定性表情之外的中性表情时，维持所述默认置信度不变。3.如权利要求1所述的方法，其中，确定与所述第一语义相关联的第一置信度还包括：判断所述第一语义中是否含有情绪关键词；如果所述第一语义中不含有情绪关键词，则执行所述基于所述第一表情来调整所述默认置信度的步骤；如果所述第一语义中含有情绪关键词，则判断所述情绪关键词与所述第一表情是否匹配；如果所述情绪关键词与所述第一表情相匹配，则增大所述默认置信度；以及如果所述情绪关键词与所述第一表情不匹配，则执行所述基于所述第一表情来调整所述默认置信度的步骤。4.如权利要求1所述的方法，确定与所述第一语义相关联的第一置信度还包括：判断所述第一语义的语义类型；如果所述第一语义的语义类型是疑问，则增大所述默认置信度；以及如果所述第一语义的语义类型是陈述或要求，则执行所述基于所述第一表情来调整所述默认置信度的步骤。5.如权利要求1所述的方法，其中，基于所述第一语义和所述第一置信度来生成第一响应信息包括：当所述第一置信度在预定阈值以上时，则生成包括与所述第一语义直接相关联的内容的第一响应信息；当所述第一置信度低于所述预定阈值时，则生成请求所述人类用户确认所述第一语义的第一响应信息。6.如权利要求5所述的方法，其中，当所述第一置信度低于所述预定阈值时所生成的第一响应信息还包括与所述第一语义间接相关联的内容。7.如权利要求1所述的方法，其中，基于所述第一语义和所述第一置信度来生成第一响应信息包括：当所述第一置信度在预定阈值以上时，则生成包括与所述第一语义直接相关联的内容2CN106373569A权利要求书2/3页的第一响应信息；当所述第一置信度低于所述预定阈值时，则将所述第一置信度与第二置信度相比较，所述第二置信度是与所述人类用户的就在所述第一语音输入之前的一个语音输入相关联的置信度；如果所述第一置信度在所述第二置信度以上，则生成请求所述人类用户确认所述第一语义的第一响应信息；以及如果所述第一置信度低于所述第二置信度，则生成请求所述人类用户确认所述第一语义、以及包括与所述第一语义间接相关联的内容的第一响应信息。8.如权利要求1所述的方法，还包括按照与所述第一表情对应的语气将所述第一响应信息合成为语音以播放给所述人类用户。9.一种语音交互装置，包括：语音识别模块，配置为识别来自人类用户的第一语音输入的第一语义；图像识别模块，配置为识别来自所述人类用户的与所述第一语音输入相关联的第一表情图像输入的第一表情；置信度单元，配置为基于所述第一语义和所述第一表情来确定与所述第一语义相关联的第一置信度；以及响应生成单元，配

相关资料

语音交互装置和方法.pdf

本申请涉及语音交互装置和方法。在一示例性实施例中，一种语音交互方法可包括：接收来自人类用户的第一语音输入和与所述第一语音输入相关联的第一表情图像输入；识别所述第一语音输入的第一语义；识别所述第一表情图像输入的第一表情；基于所述第一语义和所述第一表情确定与所述第一语义相关联的第一置信度；以及基于所述第一语义和所述第一置信度来生成第一响应信息。通过利用表情和语义来产生响应信息，该方法可以改善人机语音交互过程中人类用户的体验。

2023-06-10

996KB

人机语音交互方法和装置.pdf

本发明提出一种人机语音交互方法和装置，该人机语音交互方法包括：在终端对播报结果进行语音播报的过程中，接收语音识别服务器发送的语音识别结果；将语音识别结果发送给QU服务器进行上下文理解，接收并保存上下文理解的结果；根据保存的上下文理解的结果确定用户输入的语音的意图，根据上述意图生成播报结果；将播报结果发送给语音识别服务器，以便语音识别服务器将播报结果发送给终端进行语音播报。本发明可以实现在人机语音交互的过程中，语音播报和用户的语音输入同时进行，从而可以实现人机交互过程中不需要反复切换录音和播报两种状态，进而

2023-10-13

1.6MB

语音交互方法、装置和存储介质.pdf

本发明提供一种语音交互方法、装置和存储介质，该方法包括：接收外设端发送的第一音频并发送给服务器；接收服务器发送的第一响应音频并发送给外设端，以使外设端播放第一响应音频，第一响应音频用于确定终端对应的用户的用户意图；接收外设端发送的第二音频并发送给服务器，第二音频用于表征用户意图；接收服务器发送的第二响应音频并发送给外设端，以使外设端播放第二响应音频，第二响应音频为服务器基于用户意图获取的响应音频。本发明实现了终端和服务器之间的多轮语音交互，丰富了外设端与终端的交互功能，提高了用户体验。

2023-08-29

850KB

语音交互方法、装置和存储介质.pdf

本发明提供一种语音交互方法、装置和存储介质，该方法包括：根据服务器发送的第一响应指令，控制外设端执行第一响应指令对应的第一响应动作；接收外设端发送的第一音频，并向服务器发送第一音频，第一音频为外设端执行第一响应动作后，在第一预设时长内收取到包含有外设端对应的唤醒词的第一唤醒音频时发送的；接收服务器发送的响应第一音频的第二响应指令，并根据第二响应指令控制外设端执行第二响应指令对应的第二响应动作。本发明通过终端控制外设端执行响应动作后，在预设时间内可以用唤醒词唤醒终端，以实现外设端、终端和服务器的多轮交互，丰

2023-08-29

686KB

语音交互方法及装置.pdf

本发明涉及物联网技术领域，本发明提供一种语音交互方法及装置，该语音交互方法包括：获取语音控制指令以及用户位置信息；基于所述用户位置信息，确定目标区域；基于所述语音控制指令，确定设备属性；在所述目标区域内存在与所述设备属性匹配的目标设备的情况下，基于所述语音控制指令，向所述目标区域内的目标设备输出目标控制指令。本发明提供的语音交互方法及装置，能够在用户未给出明确的待控制对象的情况下，通过语音控制指令和用户位置信息，推导出目标设备，并对目标设备进行准确控制，这样能够提升语音交互的智能化程度，降低对用户语音输入

2023-07-24

515KB