

视听语音识别方法、装置、设备、介质及产品.pdf
一条****轩吗
亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
视听语音识别方法、装置、设备、介质及产品.pdf
本申请提供一种视听语音识别方法、装置、设备、介质及产品,该方法包括:获取待识别的视频特征和对应的含噪语谱图;所述视频特征为基于用户的唇部图像提取的特征;所述含噪语谱图为基于用户的音频数据提取生成的;将所述视频特征和所述含噪语谱图输入预设视听语音增强模型进行降噪处理,输出对应的增强语谱图;将所述增强语谱图和所述视频特征输入预设视听语音识别模型进行语音识别,输出对应的最终字符序列。本申请的视听语音识别方法,通过预设视听语音识别模型对增强语谱图和视频特征两种模态进行识别,以两种模态互补的方式,提高最终字符序列的
语音识别方法、装置、终端、系统、介质及产品.pdf
本申请属于人工智能技术领域,具体提供一种语音识别方法、装置、终端、系统、介质及产品,方法包括:获取目标用户待识别的用户语音数据;将用户语音数据输入AI芯片中训练至收敛的语音识别模型,以生成语音识别结果;其中,语音识别模型为根据用户训练样本和语音识别服务器的通用识别模型训练生成的;语音识别模型与目标用户相匹配;输出语音识别结果。本申请的语音识别方法,通过与用户匹配性较高的语音识别模型对目标用户待识别的用户语音数据进行识别,生成的语音识别结果准确性较高,同时,由于语音识别模型设于AI芯片中,不需要通过网络传输
语音识别方法、装置、设备及存储介质.pdf
本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:将目标用户语音数据输入设定声学模型中,输出所述目标用户语音数据对应的声学特征序列;其中,所述目标用户语音数据携带有地域属性;所述声学特征序列包括多个声学特征;确定所述声学特征序列中各声学特征对应的至少一个目标词,获得多个目标词;将所述多个目标词输入领域语言模型中,输出目标语音识别结果;其中,所述目标语音识别结果由词序列表征。通过本发明的技术方案,可以提高语音识别的准确性。
语音信号的识别方法、装置、电子设备、存储介质及产品.pdf
本申请提供了一种语音信号的识别方法、装置、电子设备、存储介质及产品,属于语音交互技术领域。方法包括:接收目标语音信号,确定目标语音信号包括的多个语音帧;确定多个语音帧在第一解码图中的第一路径的第一解码参数,以及确定多个语音帧在第二解码图中的第二路径的第二解码参数;在第一解码参数和第二解码参数的差值不大于预设差值的情况下,确定第一路径包括的多个第一节点和每个第一节点的解码参数;基于第一解码参数、多个第一节点和每个第一节点的解码参数,确定目标语音信号的识别结果,识别结果用于表示是否唤醒电子设备。由于既考虑了语
语音识别方法、装置、设备、存储介质和计算机程序产品.pdf
本申请公开了一种语音识别方法、装置、设备、存储介质和计算机程序产品。本申请实施例提供的语音识别方法包括:获取待识别的第一语音;根据目标语音识别模型,确定待识别的第一语音对应的第一文本信息,其中,目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的,目标词集包括在预设时间段内初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。根据本申请实施例,能够解决语音识别系统识别效率和识别准确率相对较低,影响用户使用体验的问题。