基于深度学习的端到端乐谱音符识别方法.pdf
是向****23
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
基于深度学习的端到端乐谱音符识别方法.pdf
本发明公开了基于深度学习的端到端乐谱音符识别方法,该方法一共分为三步:(1)数据预处理:需要从MuseScore中下载对应的数据集,重新编码音高和时值标签。(2)数据增强:对重新编码后的乐谱数据进行数据增强,本发明提出了4种不同的增强方法。(3)端到端模型:应用于端到端乐谱音符识别的深度卷积神经网络模型,将增强后的数据输入的模型,模型的输出为音符时值和音高。本发明在于针对打印体乐谱提出一个基于深度学习的乐谱音符识别模型,即输入整张乐谱图像到该模型,直接输出乐谱上音符的时值和音高,该模型完全端到端,能够精准
一种基于深度学习的端到端车牌识别方法.pdf
本发明提出一种基于深度学习的端到端车牌识别方法,经过高斯混合模型算法处理后输出待检测车牌的图像;卷积神经网络提取共享特征模块,将待检测车牌的图像输入已经训练过卷积神经网络算法提取特征,再经过车牌图像初步检测模块处理后输出回归位置信息、回归角度特征映射图以及对应的判别是否车牌的特征映射图;车牌初步检测模块通过对应的判别是否车牌的特征映射图分析获得置信度得分,得到一批候选车牌图像,利用非极大值抑制算法进行车牌图像融合,最后获取真实的车牌位置的图像;将真实的车牌位置的图像输入到车牌内容识别反馈模块识别出车牌内容
一种基于对比学习的端到端音障语音识别方法.pdf
本发明公开了一种基于对比学习的端到端音障语音识别方法,该方法具备语音识别能力前需要使用大量正常发音数据预训练得到一个基本模型,再迁移到音障语音识别的任务中。在训练完成后,本方法就有了音障语音识别的能力。本发明首先对音障语音数据进行频谱图上的数据增强,再通过Transformer模型中的编码器提取隐层信息,然后该隐层信息经过投影模块被提取出低维的隐表示。最后本方法在隐表示所在的低维隐空间上进行对比损失的计算。在解码过程中,解码器直接使用隐层信息进行解码。本发明的创新点在于将对比学习与Transformer模
基于端到端的图片文字序列连续识别方法.pdf
本发明涉及图像文字识别领域,特别涉及基于端到端的图片文字序列连续识别方法,本发明应用了CNN和RNN的技术,通过CNN对包含多个字符的整个图片进行特征提取,然后将同样的特征送入RNN进行重复递归使用,以实现连续预测多个字符的目的。本发明方法系统的克服了OCR识别前先要进行图片切分的弊端,简化了图像文字识别的前期处理过程,显著提高了文字识别的效率。又由于RNN递归使用了上一轮的输出数据,在更好的提升字、词序列的识别准确率的同时进一步提高了文字识别的处理效率。
一种基于深度学习的端到端目标引导型对话方法.pdf
本发明涉及自然语言处理技术领域,具体涉及一种基于深度学习的端到端目标引导型对话方法,包括如下步骤:S1:获取上一轮用户对话和当前对话历史,根据上一轮用户对话和当前对话历史初始化序列到序列模型;S2:确定当前知识库实体的行号;S3:确定当前知识库实体的列号;S4:通过注意力机制的得到最佳匹配实体;S5:迭代执行步骤S2‑S4直至最终输出下一轮对话。本发明克服了现有的端到端的对话对话效率低下,影响用户的个性化体验的技术缺陷,通过自然语言对话的精准度,提供良好的用户服务。