音频内容识别方法、装置、设备和计算机可读介质.pdf
景福****90
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频内容识别方法、装置、设备和计算机可读介质.pdf
本公开的实施例公开了音频内容识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对音频进行切分,得到语音片段集合和非语音片段集合;确定上述语音片段集合中的每个语音片段的类型和语种信息;对于上述语音片段集合中的每个语音片段,基于上述语音片段的类型和语种信息,对上述语音片段进行语音识别,得到第一识别结果。该实施方式通过将音频中的说话和音乐片段用不同的模型进行识别,使两种音频内容都能得到更好的识别效果。以及,通过使用不同的模型是被不同语种内容的音频,进一步提升了语音识别的效果。
音频识别方法、装置和计算机可读存储介质.pdf
提供了音频识别方法、装置和计算机可读存储介质。方法可以由包括云服务器的计算机设备执行,并且包括:提取待识别音频文件的音频特征;待识别音频文件进行分段,得到多个音频时间片,并基于每个音频时间片内的音频的事件类别以及所述事件类别与预设目标事件的相关性,确定与音频时间片关联的音频特征的权重;基于待识别音频文件的音频特征得到多个音频特征分段,其中每个音频特征分段对应至少一个时间片;将每个音频特征分段与音频特征组合库进行特征匹配,并基于至少一个音频时间片中的音频特征以及与其关联的权重,得到所述音频特征分段的匹配音频
音频的识别方法、装置、可读介质和电子设备.pdf
本公开涉及一种音频的识别方法、装置、可读介质和电子设备,涉及电子信息处理技术领域,该方法包括:获取待识别音频,提取用于表征待识别音频的目标音频特征,目标音频特征的维度与待识别音频的时长正相关,利用预先训练的识别模型,根据目标音频特征确定指定维度的统计特征,并根据统计特征确定待识别音频包括的目标音频事件,识别模型根据预先采集的训练音频集训练得到,训练音频集包括不同时长的训练音频。本公开中识别模型对不同时长的音频进行特征提取,以得到指定维度的统计特征,从而识别音频中包括的音频事件,无需对音频进行截取或补齐操作
音频识别方法、装置、电子设备和可读存储介质.pdf
本申请提供一种音频识别方法、装置、电子设备和可读存储介质,首先利用预先构建的第一过滤模型对待识别音频中的第一类噪声进行过滤得到第一识别音频,第一类噪声为非语音噪声。再利用预先构建的第二过滤模型对第一识别音频中的第二类噪声进行过滤得到第二识别音频,第一识别音频中包含目标语音和非目标语音,第二类噪声属于非目标语音。最后,将第二识别音频导入预先构建的识别模型,对第二识别音频中的目标语音进行处理得到对应的文本。该方案,预先对非语音噪声和属于非目标语音的噪声进行过滤处理,降低了语音识别的处理压力且排除各类噪声的干扰
会话内容识别方法、装置、设备及计算机可读介质.pdf
本申请涉及一种会话内容识别方法、装置、设备及计算机可读介质。该方法包括:获取会话文本,并将会话文本分割为至少一个目标会话片段;将目标会话片段输入预设的会话类型识别模型,以对目标会话片段添加分类标签;基于目标会话片段抽取出分类标签对应的目标事件。本申请通过分割会话并进行事件抽取,能够根据会话的上下文逻辑关系识别会话的核心内容,从而使得会话内容的识别更加符合用户的真实想法,准确度更高,解决了存在逻辑的会话内容提取不准确的技术问题。