音频分离方法、装置、电子设备及计算机可读存储介质-豆柴文库

音频分离方法、装置、电子设备及计算机可读存储介质.pdf

2023-12-03

10金币

1.2MB

23页

努力****爱静

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共23页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111724807A(43)申请公布日2020.09.29(21)申请号202010780016.4(22)申请日2020.08.05(71)申请人字节跳动有限公司地址美国加利福尼亚州(72)发明人孔秋强宋旭晨王雨轩(74)专利代理机构北京市立方律师事务所11330代理人张筱宁(51)Int.Cl.G10L21/028(2013.01)G10L25/30(2013.01)G10L25/48(2013.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书16页附图4页(54)发明名称音频分离方法、装置、电子设备及计算机可读存储介质(57)摘要本公开提供了一种音频分离方法、装置、电子设备及计算机可读存储介质，涉及音频处理领域。该方法包括：获取待分离的音频；所述待分离的音频包含至少两种类型的音轨；将所述音频输入训练后的音频分离模型，以使得所述分离模型中的第一分支基于频谱图对所述音频进行分离，得到第一分离结果，以及使得所述分离模型中的第二分支基于时域对所述音频进行分离，得到第二分离结果，并基于所述第一分离结果和所述第二分离结果得到分离后的目标音轨；所述目标音轨的类型为所述至少两种类型中的任一种，且与所述训练后的音频分离模型的分离类型相同；输出所述目标音轨。本公开达到了音乐源分离的最新性能。CN111724807ACN111724807A权利要求书1/2页1.一种音频分离方法，其特征在于，包括：获取待分离的音频；所述待分离的音频包含至少两种类型的音轨；将所述音频输入训练后的音频分离模型，以使得所述分离模型中的第一分支基于频谱图对所述音频进行分离，得到第一分离结果，以及使得所述分离模型中的第二分支基于时域对所述音频进行分离，得到第二分离结果，并基于所述第一分离结果和所述第二分离结果得到分离后的目标音轨；所述目标音轨的类型为所述至少两种类型中的任一种，且与所述训练后的音频分离模型的分离类型相同；输出所述目标音轨。2.根据权利要求1所述的音频分离方法，其特征在于，所述音频分离模型通过如下方式生成：基于预设的原始音频集生成新的目标音频集；所述目标音频集包含至少一个目标音频样本，每个目标音频样本包含至少两种类型的目标音轨样本；将所述目标音频集中的任一目标音频样本输入预设的音频分离模型，以使得所述分离模型中的第一分支基于频谱图对所述音频样本进行分离，得到第三分离结果，以及使得所述分离模型中的第二分支基于时域对所述音频样本进行分离，得到第四分离结果，并基于所述第三分离结果和所述第四分离结果得到预测音轨；基于所述预测音轨与所述任一目标音频样本中相同类型的目标音轨样本计算得到损失函数，并基于所述损失函数对所述预设的音频分离模型的各个预设参数进行更新；重复执行将所述目标音频集中的任一目标音频样本输入预设的音频分离模型，以使得所述分离模型中的第一分支基于频谱图对所述音频样本进行分离，得到第三分离结果，以及使得所述分离模型中的第二分支基于时域对所述音频样本进行分离，得到第四分离结果，并基于所述第三分离结果和所述第四分离结果得到预测音轨，以及，基于所述预测音轨与所述任一目标音频样本中相同类型的目标音轨样本计算得到损失函数，并基于所述损失函数对所述预设的音频分离模型的各个预设参数进行更新的步骤，直至所述损失函数最小值收敛，得到训练后的音频分离模型。3.根据权利要求1所述的音频分离方法，其特征在于，所述音频分离模型中的第一分支基于频谱图对所述音频进行分离，得到第一分离结果，包括：对所述音频进行傅里叶变换，得到所述音频的频谱图；计算得到所述频谱图的相位；基于所述相位确定出待分离类型的第一音轨的频谱图；对所述第一音轨的频谱图进行反傅里叶变换，得到第一音轨。4.根据权利要求1所述的音频分离方法，其特征在于，所述音频分离模型中的第二分支基于时域对所述音频进行分离，得到第二分离结果，包括：基于预设的时域回归函数对所述音频进行分离，得到待分离类型的第二音轨。5.根据权利要求1或3或4所述的音频分离方法，其特征在于，基于所述第一分离结果和所述第二分离结果得到分离后的目标音轨，包括：将第一音轨与第二音轨进行整合，得到目标音轨。6.根据权利要求2所述的音频分离方法，其特征在于，所述原始音频集包含至少一个类型的音轨，每个类型的音轨包含至少一条原始音轨；2CN111724807A权利要求书2/2页所述基于预设的原始音频集生成新的目标音频集，包括：从各个类型的各个原始音轨中各自随机提取出两段预设时长的音轨片段；将两段音轨片段进行混合，得到具有所述预设时长的、混合后的各个第一音轨片段；将不同类型的任意两个第一音轨片段进行混合，得到具有所述预设时长的、混合后的各个第二音轨片段

相关资料

音频分离方法、装置、电子设备及计算机可读存储介质.pdf

本公开提供了一种音频分离方法、装置、电子设备及计算机可读存储介质，涉及音频处理领域。该方法包括：获取待分离的音频；所述待分离的音频包含至少两种类型的音轨；将所述音频输入训练后的音频分离模型，以使得所述分离模型中的第一分支基于频谱图对所述音频进行分离，得到第一分离结果，以及使得所述分离模型中的第二分支基于时域对所述音频进行分离，得到第二分离结果，并基于所述第一分离结果和所述第二分离结果得到分离后的目标音轨；所述目标音轨的类型为所述至少两种类型中的任一种，且与所述训练后的音频分离模型的分离类型相同；输出所述目

2023-12-03

1.2MB

音频处理方法、装置、电子设备及可读存储介质.pdf

本申请公开了一种音频处理方法、装置、电子设备及可读存储介质，属于音频处理技术领域。其中，由终端执行的方法包括：获取第一人声音频和环境声音频；根据所述第一人声音频的信息量、所述环境声音频的信息量和所述终端的算力状态，确定是否向云端服务器发送所述第一人声音频和所述环境声音频，以及音频处理请求，所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理，以获取所述第一人声音频对应的目标声纹信息。能够使终端及时进行降噪处理，提高声纹识别的效率。

2023-07-25

515KB

音频处理方法、装置、电子设备及可读存储介质.pdf

本公开实施例公开了一种音频处理方法、装置、电子设备和可读存储介质。该音频处理方法包括：获取第一麦克风采集的第一音频数据和第二麦克风采集的与所述第一音频数据相对应的第二音频数据；确定所述第一音频数据和所述第二音频数据的主音源方位；基于所述第一音频数据、第二音频数据以及所述主音源方位确定目标噪音比，所述目标噪音比表示所述第一音频数据和所述第二音频数据各自的期望信号能量与非期望信号能量的比值；以及，基于所述目标噪音比，对所述第一音频数据和/或第二音频数据进行滤波并基于滤波后的第一音频数据和/或第二音频数据获取目

2023-07-25

1.2MB

音频播放方法、装置、电子设备及可读存储介质.pdf

本申请提供了一种音频播放方法、装置、电子设备及可读存储介质,所述音频播放方法包括:若接收到音频播放应用的待播放音频文件,则检测所述音频播放应用对应的应用类型和所述待播放音频文件对应的应用音效类型;依据所述应用类型和所述应用音效类型,为所述待播放音频文件匹配对应的附加音效;根据所述附加音效,播放所述待播放音频文件。本申请解决了现有技术中用户的听音体验差的技术问题。

2023-04-19

542KB

音频处理方法、装置及电子设备和计算机可读存储介质.pdf

本申请公开了一种音频处理方法、装置及一种电子设备和计算机可读存储介质，该方法包括：获取目标干声音频，确定目标干声音频中每个歌词字的起止时间；检测目标干声音频的调高和每段起止时间内的基频，并基于基频和调高确定每个歌词字的当前音名；对每个歌词字分别进行对应的第一音分跨度和多个不同的第二音分跨度的升调处理，分别得到第一和声和多个不同的第二和声；多个不同的第二音分跨度为第一音分跨度与多个不同的第三音分跨度的和，第一音分跨度与第三音分跨度相差一个数量级；将第一和声和多个不同的第二和声进行合成形成多轨和声，混合多轨和

2023-12-03

1MB