音频识别方法、装置和计算机可读存储介质.pdf
努力****冰心
亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频识别方法、装置和计算机可读存储介质.pdf
提供了音频识别方法、装置和计算机可读存储介质。方法可以由包括云服务器的计算机设备执行,并且包括:提取待识别音频文件的音频特征;待识别音频文件进行分段,得到多个音频时间片,并基于每个音频时间片内的音频的事件类别以及所述事件类别与预设目标事件的相关性,确定与音频时间片关联的音频特征的权重;基于待识别音频文件的音频特征得到多个音频特征分段,其中每个音频特征分段对应至少一个时间片;将每个音频特征分段与音频特征组合库进行特征匹配,并基于至少一个音频时间片中的音频特征以及与其关联的权重,得到所述音频特征分段的匹配音频
音频识别方法、装置、电子设备和可读存储介质.pdf
本申请提供一种音频识别方法、装置、电子设备和可读存储介质,首先利用预先构建的第一过滤模型对待识别音频中的第一类噪声进行过滤得到第一识别音频,第一类噪声为非语音噪声。再利用预先构建的第二过滤模型对第一识别音频中的第二类噪声进行过滤得到第二识别音频,第一识别音频中包含目标语音和非目标语音,第二类噪声属于非目标语音。最后,将第二识别音频导入预先构建的识别模型,对第二识别音频中的目标语音进行处理得到对应的文本。该方案,预先对非语音噪声和属于非目标语音的噪声进行过滤处理,降低了语音识别的处理压力且排除各类噪声的干扰
音频识别方法、装置、终端、耳机及可读存储介质.pdf
本申请涉及一种音频识别方法、装置、终端、耳机及可读存储介质。该方法包括:接收音频识别请求,根据所述音频识别请求生成音频识别指令;执行所述音频识别指令,基于耳机上的电声换能器录制音频片段;向服务器发送携带所述音频片段的识别请求;所述识别请求用于指示所述服务器获取与所述音频片段相关的音频信息;接收所述服务器返回的识别结果,并根据所述识别结果进行信息播放。通过上述方法,可以通过耳机实现识别音频片段的过程,并且可以将识别结果直接通过耳机播放出来,给用户带来更便捷的听觉体验,方便用户随时收录想要收听的音乐。
音频内容识别方法、装置、设备和计算机可读介质.pdf
本公开的实施例公开了音频内容识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对音频进行切分,得到语音片段集合和非语音片段集合;确定上述语音片段集合中的每个语音片段的类型和语种信息;对于上述语音片段集合中的每个语音片段,基于上述语音片段的类型和语种信息,对上述语音片段进行语音识别,得到第一识别结果。该实施方式通过将音频中的说话和音乐片段用不同的模型进行识别,使两种音频内容都能得到更好的识别效果。以及,通过使用不同的模型是被不同语种内容的音频,进一步提升了语音识别的效果。
音频分类方法、装置及计算机可读存储介质.pdf
本发明公开了一种音频分类方法、装置及计算机可读存储介质,属于电子技术领域。该方法包括:采集音频信号;对音频信号进行截取或补充,以将音频信号的时长调整为预设时长;根据音频信号的频率信息,将音频信号转换为目标音频;通过预设分类器中包括的卷积网络提取目标音频的音频特征;通过预设分类器中包括的门限循环网络提取音频特征的时序特征;根据时序特征,通过预设分类器中包括的全连接网络确定目标音频的类别为多个预设类别标识中每个预设类别标识所标识的预设类别的概率;将多个预设类别标识中概率最大的预设类别标识所标识的预设类别确定为