构建语音识别模型和语音处理的方法和系统.pdf
St****36
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
构建语音识别模型和语音处理的方法和系统.pdf
一种构建语音识别模型和语音处理的方法、系统、电子设备、计算机可读存储介质及程序产品。在构建语音识别模型的方法中,获取目标关键词(502),并确定与目标关键词语义相关联的同义词组(504)。随后,利用日标关键词和同义词组来训练语言模型,以获得目标语言模型(506)。根据目标语言模型生成第一解码图,其中第一解码图指示满足基于目标关键词和同义词组所确定的语法约束规则的多条解码路径(508),并基于第一解码图,确定语音识别模型(510)。该方法能够构建具有关键词泛化识别能力的语音识别模型。还提供了构建基于音素序列
语音识别模型的训练方法、语音识别方法和系统.pdf
本发明实施例公开了一种语音识别模型的训练方法、语音识别方法和系统,涉及语音识别技术领域。该实施例包括:将音频训练样本输入声学编码器,对音频训练样本进行编码表示,确定声学编码状态向量;将预设的词表输入语言预测器中,确定文本预测向量;将文本预测向量线输入文本映射层,得到文本输出概率分布;根据音频训练样本对应的目标文本序列和文本输出概率分布,计算第一损失函数;将文本预测向量和声学编码状态向量输入联合网络,计算第二损失函数,根据第一损失函数和第二损失函数进行迭代优化,直至满足停止条件。本实施例对语音识别模型的训练
语音识别方法、语音识别模型的训练方法、装置和设备.pdf
本申请公开了一种语音识别方法、语音识别模型的训练方法、装置和设备,属于语音交互技术领域。方法包括:获取待识别的语音数据对应的特征向量和目标语音识别模型,目标语音识别模型的结构包括共享嵌入式网络和前层网络,前层网络包括多专家网络层和自注意神经网络,多专家网络层包括目标路由矩阵和多个前馈神经网络,目标路由矩阵基于损失函数得到,共享嵌入式网络和目标路由矩阵用于确定多个前馈神经网络分别对应的概率系数;调用目标语音识别模型对特征向量进行处理,得到语音数据对应的文本内容。该方法得到的文本内容与语音数据的匹配度较高,文
语音增强模型的构建方法及系统、语音增强方法及系统.pdf
本发明公开一种语音增强模型的构建方法及系统,还公开一种利用所构建的语音增强模型实现的语音增强方法及系统,其中构建方法包括基于相对应的纯净语音和带噪语音迭代训练语音增强网络的迭代训练步骤,具体为:将带噪语音输入至所述语音增强网络,由所述语音增强网络输出相应的估计语音;计算相对应的纯净语音和估计语音之间的幅度平方相干度;计算所述估计语音的能量谱密度数据;获取预设的听觉滤波器,基于所述幅度平方相干度、所述能量谱密度数据和所述听觉滤波器计算所述估计语音的语音清晰度;基于所述语音清晰度更新所述语音增强网络。本申请基
语音识别装置、语音识别程序和语音识别方法.pdf
本发明的目的在于,提供一种便利性更高的语音识别装置的技术。本发明的语音识别装置的特征在于,具备:存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个选项曾被选择的次数的选择履历信息;接触指示接受部,其通过接触的操作接受指示;语音指示接受部,其通过语音的操作接受指示;和选项朗读部,当在规定画面中限制接触指示接受部接受指示时,该选项朗读部将规定画面中的选项以与曾被选择的次数相应的顺序语音输出,语音指示接受部对通过选项朗读部输出的选项中的任一项接受指示。