用于语音识别的语言模型的训练、语音识别方法及装置.pdf
是笛****加盟
亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
用于语音识别的语言模型的训练、语音识别方法及装置.pdf
本申请公开了一种用于语音识别的语言模型的训练、语音识别方法及装置,涉及人工智能及地图车联技术领域,该方法包括:对文本数据集中的语句进行领域分类处理,得到至少一个语句集;对每个语句集进行权重评估,以基于每个语句集的权重确定符合预定重要性条件的目标语句集;基于目标语句集对应的语句数目及权重进行计算处理,得到采样数目;根据采样数目及语句集的权重进行采样概率分配处理,得到每个语句集中语句的采样概率;从每个语句集中按照对应采样概率进行语句抽取,生成训练语句集;基于训练语句集对语言模型进行训练。本申请提升用于语音识别
语音识别模型的训练、语音识别方法、装置及设备.pdf
本申请实施例提供了一种语音识别模型的训练方法、语音识别方法、装置及设备。该方法包括:重复执行至少一个训练过程,直至第一文本数据的置信度满足停止训练条件,训练过程包括:将小语种音频数据输入至第一语音识别模型,得到第一文本数据,当第一文本数据的置信度不满足停止训练条件时,根据第一文本数据、对应的小语种音频数据以及第一样本数据,生成第二样本数据,将第二样本数据输入至第一语音识别模型,对第一语音识别模型进行训练,生成第二语音识别模型,并将第二语音识别模型作为第一语音识别模型;将第一文本数据的置信度满足停止训练条件
一种语音识别方法、装置和用于语音识别的装置.pdf
本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括:根据待处理的语音数据中各个说话人的声学特征,对所述语音数据进行切分处理,得到若干子句,每个子句包含一个说话人的语音片段;按照预设标签对所述子句进行归并处理,得到目标子句;对所述目标子句进行语音识别处理,得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一,有利于提升语音识别的准确度;并且,本发明实施例进一步还可以按照预设标签对子句进行归并处理,将存在关联关系的子句合并为目标子句,再对目标子
用于语音识别的声学模型训练方法及装置.pdf
本发明实施例提供一种用于语音识别的声学模型训练方法及装置,所述方法包括:获取训练样本;所述训练样本包括声学特征以及所述声学特征对应的训练文本;获取原始声学模型,并利用所述原始声学模型,确定每一训练文本对应的所述原始声学模型中的声学状态;根据每一训练文本对应的声学状态以及声学特征,确定每一声学状态对应的声学特征;利用每一声学状态对应的声学特征,重新训练获得所述声学状态的状态描述模型;利用重新训练获得的状态描述模型,更新所述原始声学模型中的原始状态描述模型,获得更新之后的声学模型,本发明实施例降低了模型训练复
语音识别模型的训练方法、语音识别方法、装置及设备.pdf
本申请提供了一种语音识别模型的训练方法、语音识别方法、装置及设备,属于语音识别技术领域。所述语音识别模型的训练方法包括:通过所述语音识别模型中的第一编码器,对样本语音片段的样本特征序列中多个特征子序列分别进行编码,得到多个第一特征编码;对所述多个第一特征编码进行分块,得到多个特征块;通过所述语音识别模型中的第二编码器,对所述多个特征块分别进行编码,得到多个第二特征编码;对所述多个第一特征编码和所述多个第二特征编码分别进行解码,得到多个解码文本;基于所述多个解码文本与所述样本语音片段的标注文本之间的差异,训