预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113628622A(43)申请公布日2021.11.09(21)申请号202110973383.0(22)申请日2021.08.24(71)申请人北京达佳互联信息技术有限公司地址100085北京市海淀区上地西路6号1幢1层101D1-7(72)发明人程益君徐昕媚(74)专利代理机构广州三环专利商标代理有限公司44202代理人郝传鑫贾允(51)Int.Cl.G10L15/22(2006.01)G10L21/02(2013.01)H04N21/422(2011.01)H04N21/431(2011.01)H04N21/2187(2011.01)权利要求书2页说明书16页附图7页(54)发明名称语音交互方法、装置、电子设备及存储介质(57)摘要本公开关于一种语音交互方法、装置、电子设备及存储介质,该方法包括在目标视频播放过程中,获取第一目标采集语音;基于第一目标采集语音进行语音助手唤醒识别,得到第一唤醒识别结果;若第一唤醒识别结果为唤醒目标语音助手,在目标视频对应的播放页面展示预设提示信息,预设提示信息指示目标语音助手唤醒成功,以及基于语音控制与目标视频关联的交互操作。利用本公开实施例可以提升交互便捷性、交互效率以及提升语音交互的精准性。CN113628622ACN113628622A权利要求书1/2页1.一种语音交互方法,其特征在于,包括:在目标视频播放过程中,获取第一目标采集语音;基于所述第一目标采集语音进行语音助手唤醒识别,得到第一唤醒识别结果;若所述第一唤醒识别结果为唤醒目标语音助手,在所述目标视频对应的播放页面展示预设提示信息,所述预设提示信息指示所述目标语音助手唤醒成功,以及基于语音控制与所述目标视频关联的交互操作。2.根据权利要求1所述的语音交互方法,其特征在于,所述获取第一目标采集语音包括:获取第一采集语音和所述第一采集语音采集时所述目标视频对应的第一播放语音;基于所述第一播放语音对所述第一采集语音进行声学回声消除处理,得到所述第一目标采集语音。3.根据权利要求1所述的语音交互方法,其特征在于,在所述目标视频对应的播放页面展示预设提示信息之后,所述方法还包括:获取第二采集语音和所述第二采集语音采集时所述目标视频对应的第二播放语音;基于所述第二播放语音对所述第二采集语音进行声学回声消除处理,得到第二目标采集语音;向服务器发送第一操控信息获取请求,所述第一操控信息获取请求包括所述第二目标采集语音;接收所述服务器发送的所述第二目标采集语音对应的第二操控信息;基于所述第二操控信息,执行与所述第二采集语音对应的第二目标交互操作。4.根据权利要求1至3任一所述的语音交互方法,其特征在于,在所述目标视频对应的播放页面展示预设提示信息之后,所述方法还包括:若所述第一目标采集语音包括多轮交互指示语音,将所述目标语音助手的服务模式由第一状态更新为第二状态,所述第一状态的服务模式指示在所述目标语音助手唤醒期间,执行一次基于语音控制的所述目标视频关联的交互操作,所述第二状态的服务模式指示在所述目标语音助手唤醒期间,执行至少一次基于语音控制的所述目标视频关联的交互操作。5.根据权利要求4所述的语音交互方法,其特征在于,所述方法还包括:获取第三采集语音和所述第三采集语音采集时所述目标视频对应的第三播放语音;基于所述第三播放语音对所述第三采集语音进行声学回声消除处理,得到第三目标采集语音;基于所述第三目标采集语音进行语音助手唤醒识别,得到第二唤醒识别结果;若所述第二唤醒识别结果为不唤醒所述目标语音助手,向服务器发送第二操控信息获取请求,所述第二操控信息获取请求包括所述第三目标采集语音;接收所述服务器发送的所述第三目标采集语音对应的第三操控信息;基于所述第三操控信息,执行与所述第三采集语音对应的第三目标交互操作。6.根据权利要求5所述的语音交互方法,其特征在于,所述方法还包括:若所述第二唤醒识别结果为唤醒所述目标语音助手,将所述目标语音助手的服务模式由所述第二状态更新为所述第一状态。2CN113628622A权利要求书2/2页7.一种语音交互装置,其特征在于,包括:第一目标采集语音获取模块,被配置为执行在目标视频播放过程中,获取第一目标采集语音;第一唤醒识别模块,被配置为执行基于所述第一目标采集语音进行语音助手唤醒识别,得到第一唤醒识别结果;预设提示信息展示模块,被配置为执行若所述第一唤醒识别结果为唤醒目标语音助手,在所述目标视频对应的播放页面展示预设提示信息,所述预设提示信息指示所述目标语音助手唤醒成功,以及基于语音控制与所述目标视频关联的交互操作。8.一种电子设备,其特征在于,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,