一种基于对比学习的端到端音障语音识别方法.pdf
大渊****公主
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于对比学习的端到端音障语音识别方法.pdf
本发明公开了一种基于对比学习的端到端音障语音识别方法,该方法具备语音识别能力前需要使用大量正常发音数据预训练得到一个基本模型,再迁移到音障语音识别的任务中。在训练完成后,本方法就有了音障语音识别的能力。本发明首先对音障语音数据进行频谱图上的数据增强,再通过Transformer模型中的编码器提取隐层信息,然后该隐层信息经过投影模块被提取出低维的隐表示。最后本方法在隐表示所在的低维隐空间上进行对比损失的计算。在解码过程中,解码器直接使用隐层信息进行解码。本发明的创新点在于将对比学习与Transformer模
基于端对端transformer模型的语音识别方法.pdf
本发明公开了基于端对端transformer模型的语音识别方法,该方法包括:对原始语音信息进行预处理,得到音频序列信息;结合噪声修剪技术,构建transformer语音识别网络模型;基于transformer语音识别网络模型对音频序列信息进行识别处理,得到语音识别结果。通过使用本发明,能够通过获取语音数据的全局~局部信息和高层~低层特征信息进而提高模型的语音识别准确度。本发明作为基于端对端transformer模型的语音识别方法,可广泛应用于深度学习语音识别技术领域。
一种基于深度学习的端到端车牌识别方法.pdf
本发明提出一种基于深度学习的端到端车牌识别方法,经过高斯混合模型算法处理后输出待检测车牌的图像;卷积神经网络提取共享特征模块,将待检测车牌的图像输入已经训练过卷积神经网络算法提取特征,再经过车牌图像初步检测模块处理后输出回归位置信息、回归角度特征映射图以及对应的判别是否车牌的特征映射图;车牌初步检测模块通过对应的判别是否车牌的特征映射图分析获得置信度得分,得到一批候选车牌图像,利用非极大值抑制算法进行车牌图像融合,最后获取真实的车牌位置的图像;将真实的车牌位置的图像输入到车牌内容识别反馈模块识别出车牌内容
基于深度学习的端到端乐谱音符识别方法.pdf
本发明公开了基于深度学习的端到端乐谱音符识别方法,该方法一共分为三步:(1)数据预处理:需要从MuseScore中下载对应的数据集,重新编码音高和时值标签。(2)数据增强:对重新编码后的乐谱数据进行数据增强,本发明提出了4种不同的增强方法。(3)端到端模型:应用于端到端乐谱音符识别的深度卷积神经网络模型,将增强后的数据输入的模型,模型的输出为音符时值和音高。本发明在于针对打印体乐谱提出一个基于深度学习的乐谱音符识别模型,即输入整张乐谱图像到该模型,直接输出乐谱上音符的时值和音高,该模型完全端到端,能够精准
一种基于WaveRNN的端到端语音合成方法.pdf
本发明公开了一种基于WaveRNN的端到端语音合成方法,包括如下具体步骤:S1、前端处理,标注语言形成神经网络深度学习的音频特征向量,音频特征向量与文本字符对应;S2、文本字符输入;本发明提供一种基于WaveRNN的端到端语音合成方法,采用WaveRNN架构作为语音生成器,重构损失的相位信息,梅尔频谱特征逆变换为时域波形样本,进而生成语音提升合成语音的质量,合成的语音保真度较高,本发明中WaveRNN由称为双softmax层组成组成;WaveRNN其具有与最先进的WaveNet模型的质量匹配的双softm