基于视线的语音识别方法、装置、设备及存储介质-豆柴文库

基于视线的语音识别方法、装置、设备及存储介质.pdf

2023-07-21

10金币

781KB

18页

书生****66

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114999482A(43)申请公布日2022.09.02(21)申请号202210597788.3(22)申请日2022.05.30(71)申请人东风汽车有限公司东风日产乘用车公司地址510800广东省广州市花都区风神大道12号(72)发明人陈漪农云飞刘华东(74)专利代理机构深圳市世纪恒程知识产权代理事务所44287专利代理师付海萍(51)Int.Cl.G10L15/22(2006.01)G10L15/25(2013.01)G10L15/18(2013.01)G10L15/28(2013.01)权利要求书2页说明书10页附图5页(54)发明名称基于视线的语音识别方法、装置、设备及存储介质(57)摘要本发明涉及车辆控制技术领域，其公开了基于视线的语音识别方法、装置、设备及存储介质，通过获取语音监听时间内采集的驾驶员语音信息；根据所述驾驶员语音信息确定对应的初始语义是否完整；在所述初始语义不完整时，确定所述初始语义属于语义缺失或语义冗余；在所述初始语义属于语义缺失或语义冗余时，获取视线转移状态；根据所述视线转移状态确定目标识别语义，并基于所述目标识别语义进行车辆控制，从而将驾驶员的视线结合驾驶员的语音进行意图识别，提高驾驶员意图识别的准确性。CN114999482ACN114999482A权利要求书1/2页1.一种基于视线的语音识别方法，其特征在于，所述基于视线的语音识别方法包括：获取语音监听时间内采集的驾驶员语音信息；根据所述驾驶员语音信息确定对应的初始语义是否完整；在所述初始语义不完整时，确定所述初始语义属于语义缺失或语义冗余；在所述初始语义属于语义缺失或语义冗余时，获取视线转移状态；根据所述视线转移状态确定目标识别语义，并基于所述目标识别语义进行车辆控制。2.如权利要求1所述的基于视线的语音识别方法，其特征在于，所述根据所述视线转移状态确定目标识别语义，包括：在所述初始语义属于语义冗余时，判断所述视线转移状态是否为视线转移；在所述视线转移状态为视线转移时，获取视线转移前对应的语音时间；根据所述视线转移前对应的语音时间从所述初始语义中进行语义抽取，得到目标识别语义。3.如权利要求2所述的基于视线的语音识别方法，其特征在于，所述在所述初始语义属于语义冗余时，判断所述视线转移状态是否为视线转移，包括：在所述初始语义属于语义冗余时，获取所述初始语义中一段完整语义对应的语义冗余采集时间；根据所述语义冗余采集时间确定语义冗余的视线转移状态检测时间；在所述语义冗余的视线转移状态检测时间内判断所述视线转移状态是否为视线转移。4.如权利要求1所述的基于视线的语音识别方法，其特征在于，所述根据所述视线转移状态确定目标识别语义，包括：在所述初始语义属于语义缺失时，判断所述视线转移状态是否为视线转移；在所述视线转移状态为视线转移时，延长预设时长的语音监听时间；获取所述预设时长的语音监听时间内的语音信息；将所述初始语义与所述预设时长的语音监听时间内的语音信息对应的语义进行拼接，得到目标识别语义。5.如权利要求4所述的基于视线的语音识别方法，其特征在于，所述在所述初始语义属于语义缺失时，判断所述视线转移状态是否为视线转移，包括：在所述初始语义属于语义缺失时，获取所述初始语义中结束语音对应的语义缺失采集时间；根据所述语义缺失采集时间确定语义缺失的视线转移状态检测时间；在所述语义缺失的视线转移状态检测时间内判断所述视线转移状态是否为视线转移。6.如权利要求1至5中任一项所述的基于视线的语音识别方法，其特征在于，所述根据所述驾驶员语音信息确定对应的初始语义是否完整，还包括：对所述驾驶员语音信息对应的初始语义从左到右依次计算相邻文本片段的凝聚程度；若所述凝聚程度未达到凝聚阈值，则将所述相邻文本片段进行切分，得到切分结果；根据所述切分结果进行分词统计，得到语音分词集；将所述语音分词集与词性数据库中的词语进行匹配，得到所述词性数据库中所述语音分词集对应的词性；根据所述语音分词集对应的词性确定所述初始语义是否完整。2CN114999482A权利要求书2/2页7.如权利要求6所述的基于视线的语音识别方法，其特征在于，所述确定所述初始语义属于语义缺失或语义冗余，包括：根据所述语音分词集对应的词性确定是否存在完整的语句；在所述语音分词集对应的词性确定存在完整的语句时，确定所述初始语义属于语义冗余；在所述语音分词集对应的词性确定不存在完整的语句时，确定所述初始语义属于语义缺失。8.一种基于视线的语音识别装置，其特征在于，所述基于视线的语音识别装置包括：获取模块，用于获取语音监听时间内采集的驾驶员语音信息；所述获取模块，还用于根据所述驾驶员语音信息确定对应的初始语义是否完整；所述获取模块，还用于在所述初始语义

相关资料

基于视线的语音识别方法、装置、设备及存储介质.pdf

本发明涉及车辆控制技术领域，其公开了基于视线的语音识别方法、装置、设备及存储介质，通过获取语音监听时间内采集的驾驶员语音信息；根据所述驾驶员语音信息确定对应的初始语义是否完整；在所述初始语义不完整时，确定所述初始语义属于语义缺失或语义冗余；在所述初始语义属于语义缺失或语义冗余时，获取视线转移状态；根据所述视线转移状态确定目标识别语义，并基于所述目标识别语义进行车辆控制，从而将驾驶员的视线结合驾驶员的语音进行意图识别，提高驾驶员意图识别的准确性。

2023-07-21

781KB

语音识别方法、装置、设备及存储介质.pdf

本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:将目标用户语音数据输入设定声学模型中,输出所述目标用户语音数据对应的声学特征序列;其中,所述目标用户语音数据携带有地域属性;所述声学特征序列包括多个声学特征;确定所述声学特征序列中各声学特征对应的至少一个目标词,获得多个目标词;将所述多个目标词输入领域语言模型中,输出目标语音识别结果;其中,所述目标语音识别结果由词序列表征。通过本发明的技术方案,可以提高语音识别的准确性。

2023-04-20

534KB

语音识别方法、装置、设备和存储介质.pdf

本申请属于数据处理领域，具体涉及一种语音识别方法、装置、设备和存储介质。本申请旨在解决目前的智能设备识别用户指令的准确率较低的问题。本申请的语音识别方法，该方法包括：获取终端设备上设置的N个语音采集装置采到的N个待处理语音信号；将N个待处理语音信号中第n个待处理语音信号划分为M

2023-07-24

678KB

语音识别方法、装置及存储介质.pdf

本公开是关于一种语音识别方法、装置及存储介质，属于机器学习技术领域。方法包括：获取待识别的音频帧；分别提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量；对梅尔标度滤波器组特征和发声用户信息矢量进行融合处理，得到融合特征；基于目标声学模型对融合特征进行处理，得到音频帧的语音识别结果，目标声学模型包括多个空洞卷积层。本公开会同时提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量，之后，将二者进行特征融合并将融合后的特征输入声学模型，由于融合后的特征能够对说话人特征和信道特征进行有效表达，提高了语音识别的准确

2023-06-25

785KB

基于人工智能的语音识别方法、装置及存储介质.pdf

本发明涉及人工智能，揭露一种基于人工智能的语音识别方法，包括：将获取的训练数据输入预设联合识别模型的语音识别模块中，获取所述语音识别模块的输出数据以及第一目标任务损失；将所述输出数据输入所述联合识别模型的损失预测模块中，以获取所述损失预测模块的第二目标任务损失；基于所述第一目标任务损失和所述第二目标任务损失，获取所述联合识别模型的总任务损失；基于所述训练数据对所述联合识别模型进行迭代训练，直至所述总任务损失收敛在预设范围内，形成联合识别模型；基于所述联合识别模型中的语音识别模块对待检测语音信号进行识别，并

2023-07-25

1.3MB