音频信号识别方法及装置.pdf
a是****澜吖
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频信号识别方法及装置.pdf
本发明公开一种音频信号识别方法及装置,涉及人工智能技术领域,该方法包括:获取待识别音频模拟信号,音频模拟信号具备指定人群口语特征时,将音频模拟信号输入声音特征模型,得到音频模拟信号声音特征;对音频模拟信号声音特征生成脉冲编码调制PCM音频数据;对PCM音频数据频谱图进行分帧和频域处理,得到星状图;构建指纹哈希值,提取指纹哈希值第一时间偏移;将指纹哈希值与数据库音频哈希值匹配,提取匹配的音频哈希值第二时间偏移;第一时间偏移与第二时间偏移相似度大于阈值,将哈希值与指纹哈希值匹配音频确定为音频模拟信号识别结果。
音频识别方法和装置.pdf
本发明公开一种音频识别方法和装置。其中音频识别方法包括:采集在播放音频文件时产生的音频信息;提取出隐藏在音频信息中的附加信息;从附加信息中提取出音频文件的标识信息;将标识信息呈现给用户。本发明通过在音频播放过程中采集、滤出并还原音频制作时隐藏在音频信息中的标识信息,从而实现音频的即时识别。该方法适用于通过移动终端上的应用,识别广播、广告、电视和电影中正在播放的音乐,从而提高用户体验。
音频识别方法、装置及存储介质.pdf
本发明公开了一种音频识别方法、装置及存储介质,该方法包括:获取音频文件,以及音频文件对应的文本信息,文本信息包括多个字;依次将文本信息中的每个字,设置为目标字,并获取目标字对应的时间信息,时间信息包括目标字的开始时间和目标字的结束时间;根据目标字的开始时间,确定目标字对应的多个开始调整时间,并根据目标字的结束时间,确定目标字对应的多个结束调整时间;根据目标字的多个开始调整时间和目标字的多个结束调整时间,对音频文件进行识别,得到目标字的音高信息。该方案通过在根据目标字对应的开始时间和结束时间,确定多个开始调
音频信号处理方法、音频信号处理装置及存储介质.pdf
本公开关于一种音频信号处理方法、音频信号处理装置及存储介质。音频信号处理方法包括:获取麦克风所采集的观测数据。响应于存在直达声和早期反射的协方差矩阵估计更新值,基于直达声和早期反射声的协方差矩阵估计更新值,对观测数据进行去混响处理,得到直达声和早期反射声的估计值。基于直达声和早期反射声的估计值,对多声源音频信号进行盲源分离处理,得到各声源的时域声源信号。通过本公开提供的音频信号处理方法,能够基于盲源分离算法,获取用于确定直达声和早期反射声的估计值的直达声和早期反射声的协方差矩阵,进而进行盲源分离得到各音频
一种音频信号处理方法及音频信号处理装置.pdf
本发明公开了一种音频信号处理方法,包括:获取用户在运动过程中产生的步频参数;从终端中获取待处理的音频信号;根据步频参数对音频信号的节拍频率进行修改,使得修改后音频信号的节拍频率与步频参数之差小于预设阈值;输出修改后的音频信号。本发明还提供一种可以实现上述音频信号处理方法的终端。本发明能够保持音乐节拍频率与用户运动步频一致。