预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113889079A(43)申请公布日2022.01.04(21)申请号202111153302.9G06N3/08(2006.01)(22)申请日2021.09.29(71)申请人北京搜狗科技发展有限公司地址100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间(72)发明人唐文琦(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人岳阳(51)Int.Cl.G10L15/02(2006.01)G10L15/06(2013.01)G10L15/16(2006.01)G10L25/30(2013.01)G06N3/04(2006.01)权利要求书3页说明书11页附图3页(54)发明名称特征处理方法、装置和用于处理特征的装置(57)摘要本申请实施例公开了特征处理方法、装置和用于处理特征的装置。该方法的实施例包括:对音频数据进行分帧加窗处理,并提取各窗口的音频帧特征;将首个窗口的音频帧特征输入至卷积神经网络,得到首个窗口的特征处理结果;依次将其余每个窗口作为目标窗口,执行如下步骤:确定目标窗口相对于上一窗口的重复帧特征和非重复帧特征;基于卷积神经网络确定非重复帧特征的特征处理结果,从上一窗口的特征处理结果中提取重复帧特征的特征处理结果,并基于非重复帧特征的特征处理结果和重复帧特征的特征处理结果,确定目标窗口的特征处理结果。该实施方式避免了计算资源浪费,提高了音频数据的处理效率。CN113889079ACN113889079A权利要求书1/3页1.一种特征处理方法,其特征在于,所述方法包括:对音频数据进行分帧加窗处理,并提取各窗口的音频帧特征;将首个窗口的音频帧特征输入至卷积神经网络,得到所述首个窗口的特征处理结果;依次将其余每个窗口作为目标窗口,执行如下步骤:确定所述目标窗口相对于上一窗口的重复帧特征和非重复帧特征;基于所述卷积神经网络确定所述非重复帧特征的特征处理结果,从所述上一窗口的特征处理结果中提取所述重复帧特征的特征处理结果,并基于所述非重复帧特征的特征处理结果和所述重复帧特征的特征处理结果,确定所述目标窗口的特征处理结果。2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络包括至少一个卷积层,所述特征处理结果中包括所述卷积神经网络中每个卷积层的卷积计算结果。3.根据权利要求2所述的方法,其特征在于,所述将首个窗口的音频帧特征输入至卷积神经网络,得到所述首个窗口的特征处理结果,包括:将所述首个窗口的音频帧特征输入至所述卷积神经网络的首个卷积层,得到所述首个卷积层针对所述首个窗口的卷积计算结果;对于从第二个卷积层起的每个卷积层,将上一卷积层针对所述首个窗口的卷积计算结果输入至该卷积层,得到该卷积层针对所述首个窗口的卷积计算结果。4.根据权利要求2所述的方法,其特征在于,所述确定所述目标窗口相对于上一窗口的重复帧特征和非重复帧特征,包括:基于预设的窗口长度、预设的窗口滑动步长以及所述卷积神经网络中的各卷积层中的卷积核大小,将各窗口在所述各卷积层的输入特征划分为第一部分、第二部分和第三部分;将所述目标窗口在所述各卷积层的输入特征中的第二部分,作为所述目标窗口相对于上一窗口的重复帧特征;将所述目标窗口在所述各卷积层的输入特征中的第一部分和第三部分,作为所述目标窗口相对于所述上一窗口的非重复帧特征。5.根据权利要求4所述的方法,其特征在于,所述基于所述卷积神经网络确定所述非重复帧特征的特征处理结果,从所述上一窗口的特征处理结果中提取所述重复帧特征的特征处理结果,并基于所述非重复帧特征的特征处理结果和所述重复帧特征的特征处理结果,确定所述目标窗口的特征处理结果,包括:对于所述卷积神经网络的每个卷积层,将所述目标窗口在该卷积层的输入特征中的第一部分和第三部分分别输入至该卷积层,分别得到第一卷积计算结果和第三卷积计算结果;从该卷积层针对所述上一窗口的卷积计算结果中,提取所述上一窗口在该卷积层的输入特征中的第二部分对应的卷积计算结果,作为第二卷积计算结果;将所述第一卷积计算结果、所述第二卷积计算结果和所述第三卷积计算结果进行汇总,得到该卷积层针对所述目标窗口的卷积计算结果。6.根据权利要求5所述的方法,其特征在于,所述对于所述卷积神经网络的每个卷积层,将所述目标窗口在该卷积层的输入特征中的第一部分和第三部分分别输入至该卷积层,分别得到第一卷积计算结果和第三卷积计算结果,包括:对于所述卷积神经网络的每个卷积层,基于该卷积层的第一补帧参数,对所述目标窗口在该卷积层的输入特征中的第一部分的左侧进行补帧,得到第一补音频帧特征;将所述2CN113889079A权利要求书2/3页第一补音频帧特征输入至该卷积层,得到第一卷积计算结果;对于所述卷