语音识别方法、装置、设备及存储介质.pdf
猫巷****奕声
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音识别方法、装置、设备及存储介质.pdf
本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:将目标用户语音数据输入设定声学模型中,输出所述目标用户语音数据对应的声学特征序列;其中,所述目标用户语音数据携带有地域属性;所述声学特征序列包括多个声学特征;确定所述声学特征序列中各声学特征对应的至少一个目标词,获得多个目标词;将所述多个目标词输入领域语言模型中,输出目标语音识别结果;其中,所述目标语音识别结果由词序列表征。通过本发明的技术方案,可以提高语音识别的准确性。
语音识别方法、装置、设备和存储介质.pdf
本申请属于数据处理领域,具体涉及一种语音识别方法、装置、设备和存储介质。本申请旨在解决目前的智能设备识别用户指令的准确率较低的问题。本申请的语音识别方法,该方法包括:获取终端设备上设置的N个语音采集装置采到的N个待处理语音信号;将N个待处理语音信号中第n个待处理语音信号划分为M
语音识别方法、装置及存储介质.pdf
本公开是关于一种语音识别方法、装置及存储介质,属于机器学习技术领域。方法包括:获取待识别的音频帧;分别提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量;对梅尔标度滤波器组特征和发声用户信息矢量进行融合处理,得到融合特征;基于目标声学模型对融合特征进行处理,得到音频帧的语音识别结果,目标声学模型包括多个空洞卷积层。本公开会同时提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量,之后,将二者进行特征融合并将融合后的特征输入声学模型,由于融合后的特征能够对说话人特征和信道特征进行有效表达,提高了语音识别的准确
基于视线的语音识别方法、装置、设备及存储介质.pdf
本发明涉及车辆控制技术领域,其公开了基于视线的语音识别方法、装置、设备及存储介质,通过获取语音监听时间内采集的驾驶员语音信息;根据所述驾驶员语音信息确定对应的初始语义是否完整;在所述初始语义不完整时,确定所述初始语义属于语义缺失或语义冗余;在所述初始语义属于语义缺失或语义冗余时,获取视线转移状态;根据所述视线转移状态确定目标识别语义,并基于所述目标识别语义进行车辆控制,从而将驾驶员的视线结合驾驶员的语音进行意图识别,提高驾驶员意图识别的准确性。
语音识别方法、装置、电子设备及存储介质.pdf
本公开提供了一种语音识别方法、装置、电子设备及存储介质,属于互联网技术领域。所述方法包括:将目标文本内容与指令文本模板进行匹配;当目标文本内容与任一指令文本模板相匹配,目标指令词在目标文本内容中的位置满足预设位置条件,执行目标指令词对应的操作。本公开在调用语音识别模型得到目标文本内容后,未直接基于该目标文本内容中的目标指令词执行相应操作,而是将该目标文本内容与多个指令文本模板进行匹配,在目标文本内容与任一指令文本模板相匹配的情况下,根据目标指令词在目标文本内容的位置确定是否执行目标指令词对应的操作,从而避