音频帧的处理方法、系统、装置及存储介质-豆柴文库

音频帧的处理方法、系统、装置及存储介质.pdf

2023-07-25

10金币

491KB

13页

贤惠****66

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共13页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113889131A(43)申请公布日2022.01.04(21)申请号202111145346.7G10L19/00(2013.01)(22)申请日2021.09.28(71)申请人苏州科达科技股份有限公司地址215011江苏省苏州市高新区金山路131号(72)发明人徐超宫云梅郭秀江鄢仁祥浦宏杰(74)专利代理机构北京三聚阳光知识产权代理有限公司11250代理人张琳琳(51)Int.Cl.G10L21/02(2013.01)G10L25/30(2013.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书7页附图3页(54)发明名称音频帧的处理方法、系统、装置及存储介质(57)摘要本发明公开了一种音频帧的处理方法、系统、装置及存储介质，其中，用于音频帧处理的目标音频模型被拆分为相连的多个局部模型，所述方法包括：获取当前音频帧之前的上一音频帧对应的第一状态参数，并将所述第一状态参数作为所述当前音频帧的输入状态参数；在所述输入状态参数的基础上，利用所述多个局部模型对所述当前音频帧进行处理；在对所述当前音频帧的处理过程中，生成所述当前音频帧的第二状态参数，所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。本发明提供的技术方案，能够有效地对音频帧进行实时处理。CN113889131ACN113889131A权利要求书1/2页1.一种音频帧的处理方法，其特征在于，用于音频帧处理的目标音频模型被拆分为相连的多个局部模型；所述方法包括：获取当前音频帧之前的上一音频帧对应的第一状态参数，并将所述第一状态参数作为所述当前音频帧的输入状态参数；在所述输入状态参数的基础上，利用所述多个局部模型对所述当前音频帧进行处理；在对所述当前音频帧的处理过程中，生成所述当前音频帧的第二状态参数，所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。2.根据权利要求1所述的方法，其特征在于，所述多个局部模型包括长短期记忆模型和至少一组编解码模型对，所述编解码模型对中包括相绑定的编码模型和解码模型；其中，针对任一当前解码模型而言，所述当前解码模型的输入数据包括上一个解码模型的输出结果或者所述长短期记忆模型的输出结果，以及与所述当前解码模型相绑定的编码模型的输出结果。3.根据权利要求1或2所述的方法，其特征在于，用于音频帧处理的目标音频模型被拆分为相连的多个局部模型包括：对目标音频模型中的层级结构进行划分，以形成多个局部模型各自的层级结构；在所述目标音频模型中获取层级结构对应的系数矩阵，并将获取的所述系数矩阵更新至局部模型的对应层级结构中。4.根据权利要求2所述的方法，其特征在于，所述第一状态参数用于表征各个所述局部模型在处理所述上一音频帧时产生的临时缓存数据；所述第二状态参数用于表征各个所述局部模型在处理所述当前音频帧时产生的临时缓存数据。5.根据权利要求4所述的方法，其特征在于，所述第一状态参数至少包括所述长短期记忆模型对所述上一音频帧处理时对应的隐藏元参数和记忆元参数、各个所述编码模型对所述上一音频帧处理时对应的中间状态参数及各个所述解码模型对所述上一音频帧处理时对应的中间状态参数；所述第二状态参数至少包括长短期记忆模型对所述当前音频帧处理时对应的隐藏元参数和记忆元参数、各个所述编码模型对所述当前音频帧处理时对应的中间状态参数及各个所述解码模型对所述当前音频帧处理时对应的中间状态参数。6.根据权利要求1所述的方法，其特征在于，所述第一状态参数被写入全局缓存中作为当前状态参数，并且在所述第二状态参数生成之后，将所述第二状态参数替换所述第一状态参数作为所述全局缓存中的所述当前状态参数。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：针对处理后的当前音频帧，在所述处理后的当前音频帧的尾部确定待平滑处理的子段，并对所述子段进行幅度调节后，与所述当前音频帧的后一个音频帧的头部调节后的子段进行叠加，以生成平滑处理后的音频帧。8.一种音频帧的处理系统，其特征在于，用于音频帧处理的目标音频模型被拆分为相连的多个局部模型；所述系统包括：状态参数获取单元，用于获取当前音频帧之前的上一音频帧对应的第一状态参数，并将所述第一状态参数作为所述当前音频帧的输入状态参数；音频帧处理单元，用于在所述输入状态参数的基础上，利用所述多个局部模型对所述当前音频帧进行处理；2CN113889131A权利要求书2/2页状态参数生成单元，用于在对所述当前音频帧的处理过程中，生成所述当前音频帧的第二状态参数，所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。9.一种音频帧的处理装置，其特征在于，所述装置包括处理器和存储器，所述存储器

相关资料

音频帧的处理方法、系统、装置及存储介质.pdf

本发明公开了一种音频帧的处理方法、系统、装置及存储介质，其中，用于音频帧处理的目标音频模型被拆分为相连的多个局部模型，所述方法包括：获取当前音频帧之前的上一音频帧对应的第一状态参数，并将所述第一状态参数作为所述当前音频帧的输入状态参数；在所述输入状态参数的基础上，利用所述多个局部模型对所述当前音频帧进行处理；在对所述当前音频帧的处理过程中，生成所述当前音频帧的第二状态参数，所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。本发明提供的技术方案，能够有效地对音频帧进行实时处理。

2023-07-25

491KB

音频帧处理方法、装置、电子设备及存储介质.pdf

本发明实施例公开了一种音频帧处理方法、装置、电子设备及存储介质，该方法包括：获取第一音频帧，确定所述第一音频帧对应的第一幅值增益；根据第二音频帧对应的第二幅值增益，对所述第一幅值增益进行平滑处理；和/或，根据第三音频帧对应的第三幅值增益，对所述第一幅值增益进行平滑处理；其中，所述第二音频帧为与所述第一音频帧相邻且位于所述第一音频帧之前的音频帧，所述第三音频帧为与所述第一音频帧相邻且位于所述第一音频帧之后的音频帧；基于平滑处理后的第一幅值增益，对所述第一音频帧的幅值进行调整，得到目标音频帧。通过本发明实施例

2023-06-14

2.1MB

音频处理方法、装置及存储介质.pdf

本发明实施例公开了一种音频处理方法、装置及存储介质。该方案可以获取目标歌曲的音频数据，并提取所述音频数据中的预设数据片段，以预设帧长将所述预设数据片段划分为多个数据帧，将所述多个数据帧中相匹配的数据帧归类至同一数据帧集合，以得到多个目标数据帧集合，根据所述多个目标数据帧集合，将所述预设数据片段划分为多个子片段。本申请实施例所提供的方案可以将歌曲中数据片段划分为多个数据帧，并归类为多个数据帧集合，然后将数据片段划分为多个子片段，从而划分出歌曲片段中反复咏唱的部分，进一步提升音乐分段的精确性。

2023-12-03

859KB

音频处理方法、装置及存储介质.pdf

本发明公开了一种音频处理方法、装置及存储介质，方法包括：将能量值中大于能量阈值的能量值所对应的音频片段确定为待检测音频片段；将待检测音频片段中片段时长小于预设时长的音频片段确定为待处理音频片段；根据与待处理音频片段相邻的N帧信号的幅值以及待处理音频片段的幅值确定衰减系数；根据衰减系数对待处理音频片段进行去噪处理，得到处理后的音频信号。本发明实施例将音频信号中能量值大于预设能量值的音频片段确定为待检测音频片段，然后将片段时长小于预设时长的待检测音频片段确定为待处理音频片段，最后对该待处理音频片段进行去噪处理

2023-12-04

940KB

音频处理方法、装置及存储介质.pdf

本发明实施例公开了一种音频处理方法、装置及存储介质。该方案可以获取具有目标音频标识的第一独唱音频和第二独唱音频，获取第一独唱音频当中的第一伴奏音频响度与第一人声音频响度，以及第二独唱音频当中的第二伴奏音频响度与第二人声音频响度，并确定第一独唱音频的第一声伴比以及第二独唱音频的第二声伴比，基于第一声伴比和第二声伴比，对第一伴奏音频响度与第一人声音频响度或第二伴奏音频响度与第二人声音频响度进行调整，获取目标音频标识的分段信息，并根据分段信息对调整后的第一独唱音频和第二独唱音频进行合成。本申请实施例所提供的方案

2023-12-04

932KB