语音交互方法及其装置、服务器和可读存储介质-豆柴文库

语音交互方法及其装置、服务器和可读存储介质.pdf

2023-07-24

10金币

1.4MB

27页

书生****22

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共27页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113990298A(43)申请公布日2022.01.28(21)申请号202111593401.9(22)申请日2021.12.24(71)申请人广州小鹏汽车科技有限公司地址510000广东省广州市天河区岑村松岗大街8号(72)发明人王亭玉张天宇宁洪珂潘晓彤赵恒艺赵群樊骏锋(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人赵静(51)Int.Cl.G10L15/06(2013.01)G10L15/22(2006.01)G10L15/26(2006.01)B60W50/08(2020.01)权利要求书2页说明书15页附图9页(54)发明名称语音交互方法及其装置、服务器和可读存储介质(57)摘要本发明公开了一种语音交互方法及其装置、服务器和可读存储介质。该语音交互方法包括：对车辆预设功能调节的语音请求进行语音识别得到待识别文本，预设功能指模拟对车辆零部件的操作进行刻度调节的功能；利用意图识别模型对待识别文本进行意图识别；利用精度识别模型对待识别文本进行精度识别；根据意图识别的结果和精度识别的结果，确定语音请求对应的目标意图和目标刻度调节精度值；根据目标意图和目标刻度调节精度值修改默认值，默认值为预设语音请求中目标意图对应的调节值；将目标意图和修改后的默认值融合生成控制指令，以控制对应的车辆零部件。本发明可以根据用户精简语音请求精准调节与语音请求相对应的车辆零部件的刻度，提升用户体验。CN113990298ACN113990298A权利要求书1/2页1.一种语音交互方法，其特征在于，包括：对车辆预设功能调节的语音请求进行语音识别得到待识别文本，所述预设功能指模拟对车辆零部件的操作进行刻度调节的功能；利用意图识别模型对所述待识别文本进行意图识别；利用精度识别模型对所述待识别文本进行精度识别；根据所述意图识别的结果确定所述语音请求对应的目标意图，和根据所述精度识别的结果确定所述语音请求对应的目标刻度调节精度值；根据所述目标意图和所述目标刻度调节精度值修改默认值，所述默认值为预设语音请求中所述目标意图对应的调节值；将所述目标意图和修改后的所述默认值融合生成控制指令，以控制对应的车辆零部件。2.根据权利要求1所述的语音交互方法，其特征在于，所述语音交互方法包括：通过意图训练数据训练得到所述意图识别模型，所述意图训练数据与所述车辆零部件和所述车辆零部件的可调节范围相关。3.根据权利要求1所述的语音交互方法，其特征在于，所述语音交互方法包括：通过精度训练数据训练得到所述精度识别模型，所述精度训练数据与所述车辆零部件、所述车辆零部件的可调节范围和所述车辆零部件的刻度调节精度范围相关。4.根据权利要求1所述的语音交互方法，其特征在于，所述语音交互方法包括：确定所述车辆零部件的控制范围及非控制范围。5.根据权利要求4所述的语音交互方法，其特征在于，所述语音交互方法包括：确定每个所述车辆零部件的默认调节范围。6.根据权利要求5所述的语音交互方法，其特征在于，所述语音交互方法包括：确定所述车辆零部件的可调节范围；根据所述车辆零部件的可调节范围，纠正所述预设语音请求的意图。7.根据权利要求6所述的语音交互方法，其特征在于，所述语音交互方法包括：将所述控制范围和所述可调节范围映射到预设意图和对应的预设刻度调节精度值。8.根据权利要求7所述的语音交互方法，其特征在于，所述语音交互方法包括：根据所述预设意图和所述默认调节范围，建立意图与默认值映射表。9.根据权利要求8所述的语音交互方法，其特征在于，所述根据所述目标意图和所述目标刻度调节精度值修改默认值，包括：根据所述目标意图和所述意图与默认值映射表确定所述默认值；根据所述目标刻度调节精度值修改所述默认值。10.根据权利要求8所述的语音交互方法，其特征在于，所述将所述控制范围和所述可调节范围映射到预设意图和对应的预设刻度调节精度值，包括：将所述控制范围内每个所述可调节范围，映射到一个所述预设意图，每个所述预设意图对应多个预设刻度调节精度值。11.根据权利要求10所述的语音交互方法，其特征在于，所述将所述控制范围和所述可调节范围映射到预设意图和对应的预设刻度调节精度值，包括：将精简词设置为槽位，对所述车辆零部件对应的预设识别文本进行槽位提取得到重复2CN113990298A权利要求书2/2页字段；对重复字段的槽值进行重复统计得到重复数量；根据所述精简词可调节的范围将所述重复数量映射到所述预设刻度调节精度值。12.根据权利要求11所述的语音交互方法，其特征在于，所述预设意图为多个，所述根据所述意图识别的结果确定所述语音请求对应的目标意图，包括：获取所述意图识别的结果对应各个预设意图的意图判别概率；将所述意图判别概

相关资料

语音交互方法及其装置、服务器和可读存储介质.pdf

本发明公开了一种语音交互方法及其装置、服务器和可读存储介质。该语音交互方法包括：对车辆预设功能调节的语音请求进行语音识别得到待识别文本，预设功能指模拟对车辆零部件的操作进行刻度调节的功能；利用意图识别模型对待识别文本进行意图识别；利用精度识别模型对待识别文本进行精度识别；根据意图识别的结果和精度识别的结果，确定语音请求对应的目标意图和目标刻度调节精度值；根据目标意图和目标刻度调节精度值修改默认值，默认值为预设语音请求中目标意图对应的调节值；将目标意图和修改后的默认值融合生成控制指令，以控制对应的车辆零部件

2023-07-24

1.4MB

语音交互方法、装置及可读存储介质.pdf

本申请提供了一种语音交互方法、装置及可读存储介质，涉及计算机技术领域。该方法应用于与语音处理设备基于9P协议通信的语音交互设备，语音交互设备与语音处理设备的文件系统的文件目录相同，该方法包括：将接收到的语音流对应的目标语音数据写入到语音处理设备的第一目标文件中；在第二目标文件被语音处理设备写入目标语音数据对应的目标处理结果的情况下，从第二目标文件中读取目标处理结果，并执行与目标处理结果对应的目标操作。如此，通过采用9P协议作为底层协议架构，以统一的文件接口形式进行语音处理设备和语音交互设备的语音交互，可简

2023-07-24

966KB

语音交互方法、装置、电子设备和可读存储介质.pdf

本申请实施例提供了一种语音交互方法、装置、电子设备和可读存储介质,涉及计算机技术领域。在本申请实施例中,可以通过进行补充训练的关键词检测模型对目标语音进行关键词检测,其中,由于关键词检测模型至少基于第一样本中预定范围的音频帧进行补充训练,且预定范围以第一样本中的关键词对应的结束帧作为起始点,以预定帧数作为预定范围的长度。因此,这使得补充训练后的关键词检测模型在进行语音交互时,关键词的触发时间点会集中在上述预定范围中的各音频帧,避免了提前触发以及延迟触发的问题,提高了触发关键词的时间点的准确度。

2023-04-20

976KB

语音交互方法、装置和存储介质.pdf

本发明提供一种语音交互方法、装置和存储介质，该方法包括：接收外设端发送的第一音频并发送给服务器；接收服务器发送的第一响应音频并发送给外设端，以使外设端播放第一响应音频，第一响应音频用于确定终端对应的用户的用户意图；接收外设端发送的第二音频并发送给服务器，第二音频用于表征用户意图；接收服务器发送的第二响应音频并发送给外设端，以使外设端播放第二响应音频，第二响应音频为服务器基于用户意图获取的响应音频。本发明实现了终端和服务器之间的多轮语音交互，丰富了外设端与终端的交互功能，提高了用户体验。

2023-08-29

850KB

语音交互方法、装置和存储介质.pdf

本发明提供一种语音交互方法、装置和存储介质，该方法包括：根据服务器发送的第一响应指令，控制外设端执行第一响应指令对应的第一响应动作；接收外设端发送的第一音频，并向服务器发送第一音频，第一音频为外设端执行第一响应动作后，在第一预设时长内收取到包含有外设端对应的唤醒词的第一唤醒音频时发送的；接收服务器发送的响应第一音频的第二响应指令，并根据第二响应指令控制外设端执行第二响应指令对应的第二响应动作。本发明通过终端控制外设端执行响应动作后，在预设时间内可以用唤醒词唤醒终端，以实现外设端、终端和服务器的多轮交互，丰

2023-08-29

686KB