预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113889131A(43)申请公布日2022.01.04(21)申请号202111145346.7G10L19/00(2013.01)(22)申请日2021.09.28(71)申请人苏州科达科技股份有限公司地址215011江苏省苏州市高新区金山路131号(72)发明人徐超宫云梅郭秀江鄢仁祥浦宏杰(74)专利代理机构北京三聚阳光知识产权代理有限公司11250代理人张琳琳(51)Int.Cl.G10L21/02(2013.01)G10L25/30(2013.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书7页附图3页(54)发明名称音频帧的处理方法、系统、装置及存储介质(57)摘要本发明公开了一种音频帧的处理方法、系统、装置及存储介质,其中,用于音频帧处理的目标音频模型被拆分为相连的多个局部模型,所述方法包括:获取当前音频帧之前的上一音频帧对应的第一状态参数,并将所述第一状态参数作为所述当前音频帧的输入状态参数;在所述输入状态参数的基础上,利用所述多个局部模型对所述当前音频帧进行处理;在对所述当前音频帧的处理过程中,生成所述当前音频帧的第二状态参数,所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。本发明提供的技术方案,能够有效地对音频帧进行实时处理。CN113889131ACN113889131A权利要求书1/2页1.一种音频帧的处理方法,其特征在于,用于音频帧处理的目标音频模型被拆分为相连的多个局部模型;所述方法包括:获取当前音频帧之前的上一音频帧对应的第一状态参数,并将所述第一状态参数作为所述当前音频帧的输入状态参数;在所述输入状态参数的基础上,利用所述多个局部模型对所述当前音频帧进行处理;在对所述当前音频帧的处理过程中,生成所述当前音频帧的第二状态参数,所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。2.根据权利要求1所述的方法,其特征在于,所述多个局部模型包括长短期记忆模型和至少一组编解码模型对,所述编解码模型对中包括相绑定的编码模型和解码模型;其中,针对任一当前解码模型而言,所述当前解码模型的输入数据包括上一个解码模型的输出结果或者所述长短期记忆模型的输出结果,以及与所述当前解码模型相绑定的编码模型的输出结果。3.根据权利要求1或2所述的方法,其特征在于,用于音频帧处理的目标音频模型被拆分为相连的多个局部模型包括:对目标音频模型中的层级结构进行划分,以形成多个局部模型各自的层级结构;在所述目标音频模型中获取层级结构对应的系数矩阵,并将获取的所述系数矩阵更新至局部模型的对应层级结构中。4.根据权利要求2所述的方法,其特征在于,所述第一状态参数用于表征各个所述局部模型在处理所述上一音频帧时产生的临时缓存数据;所述第二状态参数用于表征各个所述局部模型在处理所述当前音频帧时产生的临时缓存数据。5.根据权利要求4所述的方法,其特征在于,所述第一状态参数至少包括所述长短期记忆模型对所述上一音频帧处理时对应的隐藏元参数和记忆元参数、各个所述编码模型对所述上一音频帧处理时对应的中间状态参数及各个所述解码模型对所述上一音频帧处理时对应的中间状态参数;所述第二状态参数至少包括长短期记忆模型对所述当前音频帧处理时对应的隐藏元参数和记忆元参数、各个所述编码模型对所述当前音频帧处理时对应的中间状态参数及各个所述解码模型对所述当前音频帧处理时对应的中间状态参数。6.根据权利要求1所述的方法,其特征在于,所述第一状态参数被写入全局缓存中作为当前状态参数,并且在所述第二状态参数生成之后,将所述第二状态参数替换所述第一状态参数作为所述全局缓存中的所述当前状态参数。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:针对处理后的当前音频帧,在所述处理后的当前音频帧的尾部确定待平滑处理的子段,并对所述子段进行幅度调节后,与所述当前音频帧的后一个音频帧的头部调节后的子段进行叠加,以生成平滑处理后的音频帧。8.一种音频帧的处理系统,其特征在于,用于音频帧处理的目标音频模型被拆分为相连的多个局部模型;所述系统包括:状态参数获取单元,用于获取当前音频帧之前的上一音频帧对应的第一状态参数,并将所述第一状态参数作为所述当前音频帧的输入状态参数;音频帧处理单元,用于在所述输入状态参数的基础上,利用所述多个局部模型对所述当前音频帧进行处理;2CN113889131A权利要求书2/2页状态参数生成单元,用于在对所述当前音频帧的处理过程中,生成所述当前音频帧的第二状态参数,所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。9.一种音频帧的处理装置,其特征在于,所述装置包括处理器和存储器,所述存储器