一种语音识别方法、终端设备及存储介质.pdf
猫巷****志敏
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种语音识别方法、终端设备及存储介质.pdf
本发明涉及一种语音识别方法、终端设备及存储介质,该方法中包括:S1:采集原始音频数据;S2:对原始音频数据进行转码和数据增强处理后,将三种音频合并组成训练集;S3:提取训练集中各音频的声学特征;S4:构建3‑gram语言模型并进行训练;S5:构建单音素声学模型,并基于单音素构建三音素声学模型,通过训练集中各音频的声学特征模型进行训练;S6:构建说话人识别模型;S7:构建TDNN声学模型,通过说话人识别模型和三音素声学模型对训练集中各音频的声学特征的识别结果对TDNN声学模型进行训练;S8:通过发音词典、声
语音识别方法、装置及存储介质.pdf
本公开是关于一种语音识别方法、装置及存储介质,属于机器学习技术领域。方法包括:获取待识别的音频帧;分别提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量;对梅尔标度滤波器组特征和发声用户信息矢量进行融合处理,得到融合特征;基于目标声学模型对融合特征进行处理,得到音频帧的语音识别结果,目标声学模型包括多个空洞卷积层。本公开会同时提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量,之后,将二者进行特征融合并将融合后的特征输入声学模型,由于融合后的特征能够对说话人特征和信道特征进行有效表达,提高了语音识别的准确
一种语音识别方法、装置、设备及存储介质.pdf
本申请提供了一种语音识别方法、装置、设备及存储介质,其中,方法包括:获取目标混合语音的语音特征以及指定说话人的说话人特征;以趋于目标语音特征为提取方向,根据目标混合语音的语音特征以及目标说话人的说话人特征,从目标混合语音的语音特征中提取目标说话人的语音特征,以得到目标说话人的提取语音特征,其中,目标语音特征为用于获得与目标说话人的真实语音内容一致的语音识别结果的语音特征;根据指定说话人的提取语音特征,获取指定说话人的语音识别结果。经由本申请提供的语音识别方法可从包含指定说话人语音的混合语音中较为准确的识别
一种语音识别方法、装置、存储介质及设备.pdf
本申请公开了一种语音识别方法、装置、存储介质及设备,该方法包括:首先生成目标语音的音频特征,然后将其输入至预先构建的语音识别模型,识别得到目标语音的音素识别结果和初始文本识别结果中的第一实体词汇及其位置信息;接着利用预先构建的领域专业实体词汇列表,对目标语音的音素识别结果进行解码,得到第二实体词汇;确定第一实体词汇和第二实体词汇各自对应的相似实体词汇,并利用预设的语言模型对这些相似实体词汇、第一实体词汇、第二实体词汇进行打分,得到打分结果;再根据打分结果,判断是否需要利用第二实体词汇或任一相似实体词汇对第
一种语音识别方法、装置、设备及存储介质.pdf
本发明实施例提供了一种语音识别方法、装置、设备及存储介质,该方法包括:获取语音识别结果的初始文本和上下文模板;根据所述上下文模板,确定所述初始文本中的第一单字和第一词语;根据所述第一单字的第一拼音结构和所述第一词语的第二拼音结构,确定所述第一单字对应的第二单字;根据所述第二单字修正所述初始文本,得到修正后的语音识别结果。采用本发明实施例的技术方案,通过第一拼音结构和第二拼音结构的使用,实现了语音识别结果的修正,从而克服了现有技术中训练语言模型较复杂且成效甚微的问题,实现简便,成本较低。