预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109326299A(43)申请公布日2019.02.12(21)申请号201811350813.8(22)申请日2018.11.14(71)申请人平安科技(深圳)有限公司地址518033广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人赵峰王健宗肖京(74)专利代理机构北京鸿元知识产权代理有限公司11327代理人李玉琦董永辉(51)Int.Cl.G10L21/02(2013.01)权利要求书3页说明书11页附图2页(54)发明名称基于全卷积神经网络的语音增强方法、装置及存储介质(57)摘要本发明属于人工智能领域,本发明公开了一种基于全卷积神经网络的语音增强方法,包括:构建全卷积神经网络模型,所述全卷积神经网络模型包括输入层、隐含层和输出层,所述隐含层为多个卷积层,每个卷积层均具有多个滤波器;训练所述全卷积神经网络模型;将原始语音信号输入经过训练的全卷积神经网络模型;输出增强语音信号。本发明的全卷积神经网络模型中,删除了全连接层,仅包含卷积层,大大减小了神经网络的参数,使得全卷积神经网络模型可以适用于限制内存的移动设备中,并且每个输出样本仅仅依赖相邻输入,可以通过更少的权重值很好地保留语音信号的原始信息和空间排列信息。本发明还公开了一种电子装置和计算机可读存储介质。CN109326299ACN109326299A权利要求书1/3页1.一种基于全卷积神经网络的语音增强方法,应用于电子装置,其特征在于,构建全卷积神经网络模型,所述全卷积神经网络模型包括输入层、隐含层和输出层,所述隐含层为多个卷积层,每个卷积层均具有多个滤波器,所述输出层的输出模型为:Tyt=F*Rt(1)Tf×1其中,yt是输出层的第t个节点,F是滤波器的权重矩阵的转置,F∈R,f表示滤波器尺寸,Rt是隐含层的第t个节点;训练所述全卷积神经网络模型;将原始语音信号输入经过训练的全卷积神经网络模型;输出增强语音信号。2.根据权利要求1所述的基于全卷积神经网络的语音增强方法,其特征在于,根据下式构建全卷积神经网络模型的隐含层的模型:其中,表示第1个隐含层的第j个节点的输出值,xi表示输入层的第i个节点的变量,表示输入层第i个节点和第1个隐含层第k个节点的连接权重值,表示第1个隐含层第k个节点的偏移量,n表示输入层的节点数,表示第l个隐含层的第k个节点的输出值,表示第l-1个隐含层的第j个节点的输出值,表示第l个隐含层的第k个节点和第l-1个隐含层的第j个节点的连接权重值,表示第l个隐含层第k个节点的偏移量,H为隐含层的节点数,f为激励函数。3.根据权利要求2所述的基于全卷积神经网络的语音增强方法,其特征在于,训练所述全卷积神经网络模型包括:对所述全卷积神经网络模型的参数进行初始赋值,所述参数包括输入层和隐含层的连接权重值、相邻隐含层之间的连接权重值和隐含层的偏移量;构建样本集,并将所述样本集按比例划分为训练样本集和测试样本集;输入所述训练样本集中的一个训练样本,并从所述训练样本中提取特征向量;将训练样本的输入数据代入公式(1)-(3),计算隐含层各节点的输出值和输出层各节点的输出值;计算输出层各节点误差:ek=ok-yk(4)其中,ek表示输出层第k个节点的误差,ok表示输出层第k个节点的实际值,yk表示输出层第k个节点的输出值;基于误差反向传播更新所述全卷积神经网络模型的参数;输入下一个训练样本,继续更新全卷积神经网络模型的参数,直至训练样本集中的所有训练样本训练结束,完成一次迭代;设定全卷积神经网络模型的损失函数:2CN109326299A权利要求书2/3页其中,n表示输出层的节点数,ok表示输出层第k个节点的实际值,yk表示输出层第k个节点的输出值;判断训练是否满足结束条件,如果满足结束条件,则结束训练,输出经过训练的全卷积神经网络模型,如果不满足结束条件,将继续训练模型,其中,所述结束条件包括第一结束条件或/和第二结束条件中的一个或两个,第一结束条件为当前迭代次数大于设定的最大迭代次数,第二结束条件为连续多次迭代时损失函数值的变化小于设定目标值。4.根据权利要求3所述的基于全卷积神经网络的语音增强方法,其特征在于,根据下式计算测试误差:其中,MSE表示测试误差,N表示测试样本集的样本个数,表示测试样本集的样本z在输出层第k个节点的实际值,表示测试样本集的样本z在输出层第k个节点的输出值。5.根据权利要求3所述的基于全卷积神经网络的语音增强方法,其特征在于,测试样本集中的测试样本与训练样本集中的训练样本的信噪比不同,且噪声类型也不同。6.根据权利要求1至5中任一项所述的基于全卷积神经网络的语音增强方法,其特征在于,所述全卷积神经网络模型包括输入层、六个卷