语音识别方法、装置、介质及电子设备.pdf
猫巷****忠娟
亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音识别方法、装置、介质及电子设备.pdf
本公开涉及一种语音识别方法、装置、介质及电子设备。方法包括:获取目标视频数据,所述目标视频数据包括目标音频数据和目标图像数据;提取所述目标音频数据对应的第一文本数据;提取所述目标图像数据的特征信息,并根据所述特征信息,生成用于描述所述目标图像数据的第二文本数据;根据所述第二文本数据,对所述第一文本数据进行修正,得到修正后的第一文本数据。由此,可以避免因目标视频数据中杂音或者背景音乐对语音识别准确度的影响,从而提升了目标音频数据对应的文本内容的准确度。
语音识别方法、装置、电子设备及存储介质.pdf
本发明公开了一种语音识别方法、装置、电子设备及存储介质,所述方法包括:若确定上一段语音信号的识别结果为不完整文本,将上一段语音信号的识别结果确定为历史识别信息;基于历史识别信息,对当前获取到的语音信号进行语音识别。本发明实施例提供的技术方案,在确定上一段语音信号的识别结果不是完整文本后,将上一段语音信号的识别结果作为识别当前获取到的语音信号时的历史识别信息,在对当前获取到的语音信号计算语言模型得分时,增加了历史识别信息带来的影响,从而提升语音识别准确率。
语音识别方法、装置、存储介质及电子设备.pdf
本发明提供了一种语音识别方法、装置、存储介质及电子设备,所述语音识别方法包括如下步骤:获取多个样本语音数据;采用梅尔频率倒普系数对每个样本语音数据进行语音特征提取,以得到每个样本语音数据的特征矩阵;按照一预设值构建每个样本语音数据的特征矩阵的大小,以得到归一化的特征矩阵的集合;基于所述归一化的特征矩阵的集合以支持向量机算法建立一分类模型;通过所述分类模型识别目标语音数据。本发明可以准确区分多种语言的目标语音数据,特别是带有彩铃或振铃的外呼呼叫失败的语音数据。
语音识别方法、装置、电子设备及存储介质.pdf
本发明实施例提供一种语音识别方法、装置、电子设备及存储介质,该方法包括:将待识别语音输入声学模型中,得到所述待识别语音对应的音素序列;将所述音素序列输入第一语言模型中,得到所述待识别语音对应的多个候选解码文本;将所述多个候选解码文本输入第二语言模型中,得到各所述候选解码文本属于各标准语法结构的第一预测结果;基于所述第一预测结果确定所述待识别语音的识别结果。本发明实施例提供的语音识别方法、装置、电子设备及存储介质提高了语音识别的准确度。
语音识别方法、装置、电子设备及存储介质.pdf
本发明公开了一种语音识别方法、装置、电子设备及存储介质,所述方法包括:获取输入语音以及输入语音对应的用户ID;根据用户ID,在解码网络中,搜索输入语音对应的最优路径,解码网络中各词节点之间的路径标记有用户ID;根据最优路径确定输入语音对应的文本信息。本发明实施例提供的技术方案,基于一套解码网络,即可为用户提供个性化的语音识别服务,同时大大节省了硬件资源。