预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107910020A(43)申请公布日2018.04.13(21)申请号201710997581.4(22)申请日2017.10.24(71)申请人深圳和而泰智能控制股份有限公司地址518000广东省深圳市南山区高新南区科技南十路6号深圳航天科技创新研究院大厦D座10楼1010-1011(72)发明人冯澍婷刘洪涛王伟(74)专利代理机构广州三环专利商标代理有限公司44202代理人郝传鑫熊永强(51)Int.Cl.G10L25/24(2013.01)G10L25/30(2013.01)G10L25/66(2013.01)权利要求书3页说明书17页附图6页(54)发明名称鼾声检测方法、装置、设备及存储介质(57)摘要本发明实施例公开了一种鼾声检测方法、装置、设备及存储介质。该鼾声检测方法包括:获取与目标音频数据对应的目标矩阵,并将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;所述目标矩阵基于所述目标音频数据的梅尔频率倒频系数MFCC获取;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。采用本发明实施例,可用于更加简单,准确地实现鼾声检测,提高装置的效率。CN107910020ACN107910020A权利要求书1/3页1.一种鼾声检测方法,其特征在于,包括:获取与目标音频数据对应的目标矩阵,并将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;所述目标矩阵基于所述目标音频数据的梅尔频率倒频系数MFCC获取;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。2.根据权利要求1所述的方法,其特征在于,所述获取与目标音频数据对应的目标矩阵包括:计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;将所述X*Y系数矩阵中各信号帧的MFCC依次首尾相连得到长度为X*Y的第一一维矩阵;按预设步长从所述第一一维矩阵头部到所述第一一维矩阵尾部对所述第一一维矩阵进行分割,获得包括一组长度均为预设长度的第二一维矩阵的目标矩阵,每个所述第二一维矩阵具有相同的标签,所述预设步长为每帧MFCC长度的整数倍,所述预设长度为所述每帧MFCC长度的整数倍。3.根据权利要求1或2所述的方法,其特征在于,所述目标音频数据的周期满足预设周期包括:所述目标音频数据的时域周期满足预设时域周期,和/或,所述目标音频数据的频域周期满足预设频域周期。4.根据权利要求3所述的方法,其特征在于,所述目标矩阵携带有目标权重,在所述目标矩阵的数量为M时,所述目标矩阵离所述目标音频数据的时域中心的距离越近,所述目标权重越高,所述M为大于1的整数;所述将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果包括:将所述目标矩阵输入所述目标DNN模型,得到M个预测结果,依据所述M个预测结果以及所述目标权重确定所述判别结果。5.根据权利要求1所述的方法,其特征在于,所述将所述目标矩阵输入目标深度神经网络DNN模型中之前,所述方法还包括:获取所述目标DNN模型。6.根据权利要求5所述的方法,其特征在于,所述获取所述目标DNN模型包括:获取音频数据样本;计算所述音频数据样本的MFCC,得到N*L系数矩阵,其中,N为所述音频数据样本的帧数,L为MFCC系数长度;将所述N*L系数矩阵中各信号帧的MFCC依次首尾相连得到长度为N*L的第三一维矩阵;按预设步长从所述第三一维矩阵头部到所述第三一维矩阵尾部对所述第三一维矩阵进行分割,获得包括一组长度均为预设长度的第四一维矩阵的训练矩阵,每个所述第四一维矩阵具有相同的标签,所述预设步长为每帧MFCC长度的整数倍,所述预设长度为所述每帧MFCC长度的整数倍;利用所述训练矩阵训练DNN模型,得到所述目标DNN模型。7.一种鼾声检测装置,其特征在于,包括:2CN107910020A权利要求书2/3页第一获取单元,用于获取与目标音频数据对应的目标矩阵,所述目标矩阵为基于所述目标音频数据的梅尔频率倒频系数MFCC获取;输入获得单元,用于将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;确定单元,用于在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。8.根据权利要求7所述的装置,其特征在于,所述第一获取单元包括:第一计算子单元,用于计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;第一处理子单元,将所述X*Y系数矩阵中各信号帧的MFCC依次首尾相连得到长度为X*Y的第一一维矩阵;第一分割子单元,用于