一种基于对比学习的端到端音障语音识别方法.pdf
大渊****公主
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于对比学习的端到端音障语音识别方法.pdf
本发明公开了一种基于对比学习的端到端音障语音识别方法,该方法具备语音识别能力前需要使用大量正常发音数据预训练得到一个基本模型,再迁移到音障语音识别的任务中。在训练完成后,本方法就有了音障语音识别的能力。本发明首先对音障语音数据进行频谱图上的数据增强,再通过Transformer模型中的编码器提取隐层信息,然后该隐层信息经过投影模块被提取出低维的隐表示。最后本方法在隐表示所在的低维隐空间上进行对比损失的计算。在解码过程中,解码器直接使用隐层信息进行解码。本发明的创新点在于将对比学习与Transformer模
一种基于深度学习的端到端车牌识别方法.pdf
本发明提出一种基于深度学习的端到端车牌识别方法,经过高斯混合模型算法处理后输出待检测车牌的图像;卷积神经网络提取共享特征模块,将待检测车牌的图像输入已经训练过卷积神经网络算法提取特征,再经过车牌图像初步检测模块处理后输出回归位置信息、回归角度特征映射图以及对应的判别是否车牌的特征映射图;车牌初步检测模块通过对应的判别是否车牌的特征映射图分析获得置信度得分,得到一批候选车牌图像,利用非极大值抑制算法进行车牌图像融合,最后获取真实的车牌位置的图像;将真实的车牌位置的图像输入到车牌内容识别反馈模块识别出车牌内容
基于端对端transformer模型的语音识别方法.pdf
本发明公开了基于端对端transformer模型的语音识别方法,该方法包括:对原始语音信息进行预处理,得到音频序列信息;结合噪声修剪技术,构建transformer语音识别网络模型;基于transformer语音识别网络模型对音频序列信息进行识别处理,得到语音识别结果。通过使用本发明,能够通过获取语音数据的全局~局部信息和高层~低层特征信息进而提高模型的语音识别准确度。本发明作为基于端对端transformer模型的语音识别方法,可广泛应用于深度学习语音识别技术领域。
基于深度学习的端到端乐谱音符识别方法.pdf
本发明公开了基于深度学习的端到端乐谱音符识别方法,该方法一共分为三步:(1)数据预处理:需要从MuseScore中下载对应的数据集,重新编码音高和时值标签。(2)数据增强:对重新编码后的乐谱数据进行数据增强,本发明提出了4种不同的增强方法。(3)端到端模型:应用于端到端乐谱音符识别的深度卷积神经网络模型,将增强后的数据输入的模型,模型的输出为音符时值和音高。本发明在于针对打印体乐谱提出一个基于深度学习的乐谱音符识别模型,即输入整张乐谱图像到该模型,直接输出乐谱上音符的时值和音高,该模型完全端到端,能够精准
端到端语音识别模型处理方法、语音识别方法及相关装置.pdf
本发明提供的端到端语音识别模型处理方法、语音识别方法及相关装置,方法包括:获取预设词表和文本语料集;其中,所述预设词表用于维护任意一种直播领域中的热词、所述热词对应的发音路径和建模单元;根据所述文本语料集,训练初始的语言模型的模型参数,得到所述直播领域对应的目标语言模型;根据所述热词的发音路径和建模单元,更新所述目标语言模型,并确定更新后的目标语言模型中所述热词的权重;根据更新后的所述目标语言模型,生成端到端语音识别模型。由于在生成的目标语音识别模型中包含了直播领域中的热词的权重,因而使得模型能够实在语音