语音交互方法及其装置、服务器和可读存储介质.pdf
书生****22
亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音交互方法及其装置、服务器和可读存储介质.pdf
本发明公开了一种语音交互方法及其装置、服务器和可读存储介质。该语音交互方法包括:对车辆预设功能调节的语音请求进行语音识别得到待识别文本,预设功能指模拟对车辆零部件的操作进行刻度调节的功能;利用意图识别模型对待识别文本进行意图识别;利用精度识别模型对待识别文本进行精度识别;根据意图识别的结果和精度识别的结果,确定语音请求对应的目标意图和目标刻度调节精度值;根据目标意图和目标刻度调节精度值修改默认值,默认值为预设语音请求中目标意图对应的调节值;将目标意图和修改后的默认值融合生成控制指令,以控制对应的车辆零部件
语音交互方法、装置及可读存储介质.pdf
本申请提供了一种语音交互方法、装置及可读存储介质,涉及计算机技术领域。该方法应用于与语音处理设备基于9P协议通信的语音交互设备,语音交互设备与语音处理设备的文件系统的文件目录相同,该方法包括:将接收到的语音流对应的目标语音数据写入到语音处理设备的第一目标文件中;在第二目标文件被语音处理设备写入目标语音数据对应的目标处理结果的情况下,从第二目标文件中读取目标处理结果,并执行与目标处理结果对应的目标操作。如此,通过采用9P协议作为底层协议架构,以统一的文件接口形式进行语音处理设备和语音交互设备的语音交互,可简
语音交互方法、装置、电子设备和可读存储介质.pdf
本申请实施例提供了一种语音交互方法、装置、电子设备和可读存储介质,涉及计算机技术领域。在本申请实施例中,可以通过进行补充训练的关键词检测模型对目标语音进行关键词检测,其中,由于关键词检测模型至少基于第一样本中预定范围的音频帧进行补充训练,且预定范围以第一样本中的关键词对应的结束帧作为起始点,以预定帧数作为预定范围的长度。因此,这使得补充训练后的关键词检测模型在进行语音交互时,关键词的触发时间点会集中在上述预定范围中的各音频帧,避免了提前触发以及延迟触发的问题,提高了触发关键词的时间点的准确度。
语音交互方法、装置和存储介质.pdf
本发明提供一种语音交互方法、装置和存储介质,该方法包括:接收外设端发送的第一音频并发送给服务器;接收服务器发送的第一响应音频并发送给外设端,以使外设端播放第一响应音频,第一响应音频用于确定终端对应的用户的用户意图;接收外设端发送的第二音频并发送给服务器,第二音频用于表征用户意图;接收服务器发送的第二响应音频并发送给外设端,以使外设端播放第二响应音频,第二响应音频为服务器基于用户意图获取的响应音频。本发明实现了终端和服务器之间的多轮语音交互,丰富了外设端与终端的交互功能,提高了用户体验。
语音交互方法、装置和存储介质.pdf
本发明提供一种语音交互方法、装置和存储介质,该方法包括:根据服务器发送的第一响应指令,控制外设端执行第一响应指令对应的第一响应动作;接收外设端发送的第一音频,并向服务器发送第一音频,第一音频为外设端执行第一响应动作后,在第一预设时长内收取到包含有外设端对应的唤醒词的第一唤醒音频时发送的;接收服务器发送的响应第一音频的第二响应指令,并根据第二响应指令控制外设端执行第二响应指令对应的第二响应动作。本发明通过终端控制外设端执行响应动作后,在预设时间内可以用唤醒词唤醒终端,以实现外设端、终端和服务器的多轮交互,丰