音频分类识别方法、装置、电子设备及存储介质.pdf
努力****甲寅
亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频分类识别方法、装置、电子设备及存储介质.pdf
本公开关于一种音频分类识别方法、装置、电子设备及存储介质。该方法包括:通过获取待识别音频的音频特征;然后将音频特征输入目标卷积神经网络,对目标卷积神经网络的末端解码单元输出的第一特征,以及目标卷积神经网络中的至少一个编码单元输出的第二特征,进行特征融合处理,得到待识别音频的目标音频特征;最后基于目标音频特征,确定待识别音频对应的分类识别结果。本公开实现了将目标卷积神经网络与音频分类识别进行结合,将音频特征利用目标卷积神经网络进行特征提取并融合,得到了待识别音频的多层次的目标音频特征,并依据该目标音频特征对
音频识别方法、装置、电子设备和存储介质.pdf
本公开是关于一种音频识别方法、装置、电子设备和存储介质。该方法包括:获取查询内容;所述查询内容包括表征待识别音频的片段信息;从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段;将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。本实施例中可以利用部分片段信息即可从预设库中识别出相匹配的目标音频片段和目标音频,有利于提升识别效率,提高使用体验。
音频识别方法、装置、电子设备和可读存储介质.pdf
本申请提供一种音频识别方法、装置、电子设备和可读存储介质,首先利用预先构建的第一过滤模型对待识别音频中的第一类噪声进行过滤得到第一识别音频,第一类噪声为非语音噪声。再利用预先构建的第二过滤模型对第一识别音频中的第二类噪声进行过滤得到第二识别音频,第一识别音频中包含目标语音和非目标语音,第二类噪声属于非目标语音。最后,将第二识别音频导入预先构建的识别模型,对第二识别音频中的目标语音进行处理得到对应的文本。该方案,预先对非语音噪声和属于非目标语音的噪声进行过滤处理,降低了语音识别的处理压力且排除各类噪声的干扰
音频识别方法、装置及存储介质.pdf
本发明公开了一种音频识别方法、装置及存储介质,该方法包括:获取音频文件,以及音频文件对应的文本信息,文本信息包括多个字;依次将文本信息中的每个字,设置为目标字,并获取目标字对应的时间信息,时间信息包括目标字的开始时间和目标字的结束时间;根据目标字的开始时间,确定目标字对应的多个开始调整时间,并根据目标字的结束时间,确定目标字对应的多个结束调整时间;根据目标字的多个开始调整时间和目标字的多个结束调整时间,对音频文件进行识别,得到目标字的音高信息。该方案通过在根据目标字对应的开始时间和结束时间,确定多个开始调
音频处理方法、装置、存储介质及电子设备.pdf
本申请公开了一种音频处理方法,包括:获取歌曲音频以及该歌曲音频对应的伴奏音频;若该歌曲音频和该伴奏音频的采样率不一致,则对该歌曲音频和该伴奏音频的采样率进行预设处理,以使该歌曲音频和该伴奏音频的采样率一致;对采样率一致的该歌曲音频和该伴奏音频进行音频特征检测,得到音频特征检测结果;提取该歌曲音频的第一音频指纹信息以及该伴奏音频的第二音频指纹信息,并对该第一音频指纹信息和该第二音频指纹信息进行匹配,得到音频指纹信息匹配结果;根据该音频特征检测结果和该音频指纹信息匹配结果,输出该歌曲音频和该伴奏音频的时间偏移