预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115083425A(43)申请公布日2022.09.20(21)申请号202210499013.2G10L17/04(2013.01)(22)申请日2022.05.09G10L17/18(2013.01)G10L25/24(2013.01)(71)申请人浙江大胜达包装股份有限公司G10L25/45(2013.01)地址311215浙江省杭州市萧山区萧山经济技术开发区红垦农场垦瑞路518号申请人浙江省北大信息技术高等研究院杭州未名信科科技有限公司(72)发明人潘帅陈家银张伟陈曦麻志毅(74)专利代理机构北京辰权知识产权代理有限公司11619专利代理师付婧(51)Int.Cl.G10L17/22(2013.01)G10L17/02(2013.01)权利要求书2页说明书10页附图4页(54)发明名称一种基于轻量级深度残差卷积网络的语音唤醒方法与装置(57)摘要本申请涉及深度学习及语音唤醒技术领域,更为具体来说,本申请涉及一种基于轻量级深度残差卷积网络的语音唤醒方法与装置。所述方法包括获取语音样本数据;将所述语音样本数据作为训练样本输入基于轻量级深度残差卷积网络的语音唤醒模型中进行训练;采用训练好的基于轻量级深度残差卷积网络的语音唤醒模型对目标语音进行唤醒;其中,所述基于轻量级深度残差卷积网络的语音唤醒模型设置有残差因果卷积模块。本申请提出的方法与装置既具备高效性,又具备准确性,从而大幅提升了语音唤醒的效率。CN115083425ACN115083425A权利要求书1/2页1.一种基于轻量级深度残差卷积网络的语音唤醒方法,其特征在于,所述方法包括:获取语音样本数据;将所述语音样本数据作为训练样本输入基于轻量级深度残差卷积网络的语音唤醒模型中进行训练;采用训练好的基于轻量级深度残差卷积网络的语音唤醒模型对目标语音进行唤醒;其中,所述基于轻量级深度残差卷积网络的语音唤醒模型设置有残差因果卷积模块。2.根据权利要求1所述的基于轻量级深度残差卷积网络的语音唤醒方法,其特征在于,基于轻量级深度残差卷积网络的语音唤醒模型还包括第一前馈网络和特征提取模块,所述采用训练好的基于轻量级深度残差卷积网络的语音唤醒模型对目标语音进行唤醒,包括:将所述目标语音输入所述特征提取模块,转换为原始语音特征;将所述原始语音特征输入所述第一前馈网络,进行非线性变换得到第一语音特征;将所述第一语音特征输入所述残差因果卷积模块处理,得到所述目标语音对应的关键词概率。3.根据权利要求2所述的基于轻量级深度残差卷积网络的语音唤醒方法,其特征在于,所述残差因果卷积模块包括五层残差因果卷积块、非线性变换块、平均池化层和感知层;所述五层残差因果卷积块依次设置,每一层残差因果卷积块的卷积步长以2的倍数增长;所述非线性变换块包括两层第二前馈网络,每层第二前馈网络同时集成有批归一化处理块。4.根据权利要求3所述的基于轻量级深度残差卷积网络的语音唤醒方法,其特征在于,所述将所述第一语音特征输入所述残差因果卷积模块处理,得到所述目标语音对应的关键词概率,包括:第一层残差因果步骤,将所述第一语音特征经第一层残差因果卷积块执行卷积操作得到第二语音特征,将所述第二语音特征与所述第一语音特征进行加和操作后的结果输入第二层残差因果卷积块;第二层残差因果步骤,将所述第二语音特征与所述第一语音特征进行加和操作后的结果经第二层残差因果卷积块执行卷积操作得到第三语音特征,将所述第三语音特征与所述第一语音特征、所述第二语音特征进行加和操作后的结果输入第三层残差因果卷积块;按照第一层残差因果步骤和第二层残差因果步骤执行,依次得到第四语音特征、第五语音特征和第六语音特征;将第二语音特征、第三语音特征、第四语音特征、第五语音特征和第六语音特征进行连接,得到第七语音特征;将所述第七语音特征依次经非线性变换块、平均池化层和感知层处理,得到所述目标语音对应的关键词概率。5.根据权利要求3所述的基于轻量级深度残差卷积网络的语音唤醒方法,其特征在于,所述五层残差因果卷积块中的每一层残差因果卷积块均包括因果扩展卷积块和门激活函数,所述门激活函数公式为:z=tanh(Wf*x)⊙σ(Wg*x)其中,σ(·)为sigmoid函数,Wf表示用于过滤的卷积核,Wg表示用于门计算的卷积核,⊙表示点积,x表示因果扩展卷积块扩展结果,z表示门激活函数。6.根据权利要求2所述的基于轻量级深度残差卷积网络的语音唤醒方法,其特征在于,2CN115083425A权利要求书2/2页所述将所述目标语音输入所述特征提取模块,转换为原始语音特征,包括:将所述目标语音依次进行预加重、分帧、加窗、快速傅里叶变换;将快速傅里叶变换后得到的结果基于梅尔频率倒谱系数进行提取语音特征,得到所述原始语音特征