音频识别方法和装置.pdf
Ch****49
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频识别方法和装置.pdf
本发明公开一种音频识别方法和装置。其中音频识别方法包括:采集在播放音频文件时产生的音频信息;提取出隐藏在音频信息中的附加信息;从附加信息中提取出音频文件的标识信息;将标识信息呈现给用户。本发明通过在音频播放过程中采集、滤出并还原音频制作时隐藏在音频信息中的标识信息,从而实现音频的即时识别。该方法适用于通过移动终端上的应用,识别广播、广告、电视和电影中正在播放的音乐,从而提高用户体验。
音频识别方法、装置、电子设备和存储介质.pdf
本公开是关于一种音频识别方法、装置、电子设备和存储介质。该方法包括:获取查询内容;所述查询内容包括表征待识别音频的片段信息;从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段;将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。本实施例中可以利用部分片段信息即可从预设库中识别出相匹配的目标音频片段和目标音频,有利于提升识别效率,提高使用体验。
音频的识别方法、装置、可读介质和电子设备.pdf
本公开涉及一种音频的识别方法、装置、可读介质和电子设备,涉及电子信息处理技术领域,该方法包括:获取待识别音频,提取用于表征待识别音频的目标音频特征,目标音频特征的维度与待识别音频的时长正相关,利用预先训练的识别模型,根据目标音频特征确定指定维度的统计特征,并根据统计特征确定待识别音频包括的目标音频事件,识别模型根据预先采集的训练音频集训练得到,训练音频集包括不同时长的训练音频。本公开中识别模型对不同时长的音频进行特征提取,以得到指定维度的统计特征,从而识别音频中包括的音频事件,无需对音频进行截取或补齐操作
一种音频数据的识别方法和装置.pdf
本发明公开了一种音频数据的识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将音频数据输入至第一识别模型,根据第一识别模型的输出结果确定多个优选识别结果和最优置信度分数;按照对应的最优置信度分数小于预设第一阈值的选择标准,从音频数据中选出输入至目标识别模型的目标音频数据,以通过目标识别模型得到第二识别结果;将多个优选识别结果输入至序列转换模型中,得到多个序列转换结果;根据多个序列转换结果对第二识别结果进行校验,在校验通过的情况下,将第二识别结果作为音频数据的目标识别结果。该实施方式能够无需依
音频识别方法、装置及存储介质.pdf
本发明公开了一种音频识别方法、装置及存储介质,该方法包括:获取音频文件,以及音频文件对应的文本信息,文本信息包括多个字;依次将文本信息中的每个字,设置为目标字,并获取目标字对应的时间信息,时间信息包括目标字的开始时间和目标字的结束时间;根据目标字的开始时间,确定目标字对应的多个开始调整时间,并根据目标字的结束时间,确定目标字对应的多个结束调整时间;根据目标字的多个开始调整时间和目标字的多个结束调整时间,对音频文件进行识别,得到目标字的音高信息。该方案通过在根据目标字对应的开始时间和结束时间,确定多个开始调