一种语音识别模型构建及语音识别方法、装置及存储介质.pdf
冬易****娘子
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种语音识别模型构建及语音识别方法、装置及存储介质.pdf
本发明提供了一种语音识别模型构建及语音识别方法、装置及存储介质,其中,语音识别模型构建方法包括:获取音频数据集;对音频数据集中的每一音频数据进行特征提取,得到每一个音频数据的目标音频特征并构建得到目标音频特征数据集;利用目标音频特征数据集对目标识别模型中各组成模型进行联合训练直至训练结果满足预设条件,其中,目标识别模型由音素识别模型、发音识别模型及语言识别模型级联构成,音素识别模型的输出为发音识别模型输入,发音识别模型的输出为语言识别模型输入。本发明可实现在有限训练数据量条件下,提高语音识别准确率的目的。
一种语音识别模型构建及语音识别方法、装置.pdf
本发明提供了一种语音识别模型构建及语音识别方法、装置,其中,语音识别模型构建方法包括:获取音频数据集;确定音频数据集中每一个音频数据的长度;当任一音频数据的长度大于预设长度则从音频数据中选取预设长度的音频数据作为训练样本,当任一音频数据的长度小于预设长度则将音频数据作为训练样本;对训练样本中的每一音频数据进行特征提取,得到每一个音频数据的目标语音特征并构建得到目标语音特征数据集;利用目标语音特征数据集对目标识别模型进行训练直至训练结果满足预设条件。本发明可解决现有技术中基于整条音频进行训练时速度慢及受静音
语音识别方法、装置及存储介质.pdf
本公开是关于一种语音识别方法、装置及存储介质,属于机器学习技术领域。方法包括:获取待识别的音频帧;分别提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量;对梅尔标度滤波器组特征和发声用户信息矢量进行融合处理,得到融合特征;基于目标声学模型对融合特征进行处理,得到音频帧的语音识别结果,目标声学模型包括多个空洞卷积层。本公开会同时提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量,之后,将二者进行特征融合并将融合后的特征输入声学模型,由于融合后的特征能够对说话人特征和信道特征进行有效表达,提高了语音识别的准确
一种语音识别方法、语音识别装置、电子设备及存储介质.pdf
本申请公开了一种语音识别方法、语音识别装置,电子设备及存储介质,所述方法包括:获取当前语音识别场景下的多个语音数据;多个语音数据包括多个语音采集器采集的当前语音识别场景下的多个对象的语音数据;多个语音采集器位于当前语音识别场景中的不同位置;基于多个语音数据,生成与多个对象中的每一对象关联的目标语音数据;每一对象关联的目标语音数据来源于多个语音数据中的至少两个语音数据;基于多个目标语音数据生成语音识别结果,并输出语音识别结果;如此,无需人为的分析语音数据,减少了语音数据的计算量,保证了语音分析结果的准确度。
语音识别方法、装置、设备及存储介质.pdf
本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:将目标用户语音数据输入设定声学模型中,输出所述目标用户语音数据对应的声学特征序列;其中,所述目标用户语音数据携带有地域属性;所述声学特征序列包括多个声学特征;确定所述声学特征序列中各声学特征对应的至少一个目标词,获得多个目标词;将所述多个目标词输入领域语言模型中,输出目标语音识别结果;其中,所述目标语音识别结果由词序列表征。通过本发明的技术方案,可以提高语音识别的准确性。