预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114220410A(43)申请公布日2022.03.22(21)申请号202111322201.XG10L21/0356(2013.01)(22)申请日2021.11.09H04M1/72442(2021.01)(71)申请人杭州网易云音乐科技有限公司地址310052浙江省杭州市萧山区钱江世纪城奔竞大道353号杭州国际博览中心A座1201室(72)发明人邵显根蔡辉廖祥俐李涛李文朋(74)专利代理机构北京博思佳知识产权代理有限公司11415代理人董晓盈(51)Int.Cl.G10H1/36(2006.01)G10L15/02(2006.01)G10L15/16(2006.01)权利要求书2页说明书16页附图6页(54)发明名称音频处理方法、装置、计算设备及介质(57)摘要本公开的实施方式提供了一种音频处理方法、装置、计算设备及介质。该方法通过在获取到待处理音频后,自动为待处理音频创建一条目标数据记录,并自动触发伴奏音频、第二歌词文件等目标数据的生成过程,进而在生成目标数据后,自动在目标数据记录中添加数据信息,而数据信息可以体现基于对待处理音频的操作而生成的数据的信息,以便后续可以通过目标数据记录中所记录的数据信息获取到作为伴奏物料的目标数据,实现待处理音频的自动化处理,从而提高对待处理音频的处理效率。CN114220410ACN114220410A权利要求书1/2页1.一种音频处理方法,其特征在于,所述方法包括:响应于获取到待处理音频,为所述待处理音频创建目标数据记录;基于所述待处理音频和所述待处理音频对应的第一歌词文件,生成目标数据,所述第一歌词文件为逐句划分的歌词文件,所述目标数据至少包括伴奏音频和第二歌词文件,所述第二歌词文件为逐字划分的歌词文件;在所述目标数据记录中添加数据信息,以基于所述数据信息获取所述目标数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述待处理音频和所述待处理音频对应的第一歌词文件,生成目标数据,包括:从所述待处理音频中,获取人声音频和所述伴奏音频;基于所述人声音频和所述第一歌词文件,生成所述第二歌词文件。3.根据权利要求2所述的方法,其特征在于,所述从所述待处理音频中,获取人声音频和所述伴奏音频,包括:将所述待处理音频分别输入提取人声神经网络和伴奏提取神经网络,分别通过人声提取神经网络,对所述待处理音频进行降采样处理和第一卷积处理,得到所述人声音频,通过伴奏提取神经网络,对所述待处理音频进行降采样处理和第二卷积处理,得到所述伴奏音频;其中,所述人声提取神经网络进行第一卷积处理所使用的网络参数,与所述伴奏提取神经网络进行第二卷积处理所使用的网络参数不同。4.根据权利要求2所述的方法,其特征在于,所述基于所述人声音频和所述第一歌词文件,生成所述第二歌词文件,包括:将所述人声音频输入语音识别神经网络,通过所述语音识别神经网络,输出所述人声音频对应的第一音素以及所述第一音素对应的时间戳;获取所述第一歌词文件中各个字对应的第二音素;基于所述第一音素和所述第一音素对应的时间戳,以及所述第二音素,确定所述第一歌词文件中各个字对应的时间戳,得到所述第二歌词文件。5.根据权利要求1所述的方法,其特征在于,所述目标数据还包括乐器数字接口MIDI文件;所述基于所述待处理音频和所述待处理音频对应的第一歌词文件,生成目标数据,还包括:基于所述待处理音频和所述第二歌词文件,生成所述MIDI文件。6.根据权利要求5所述的方法,其特征在于,所述基于所述待处理音频和所述第二歌词文件,生成所述MIDI文件,包括:将所述待处理音频输入旋律提取神经网络,通过所述旋律提取神经网络,输出所述待处理音频的基音;基于所述待处理音频的基音和所述第二歌词文件,生成所述MIDI文件。7.根据权利要求1所述的方法,其特征在于,所述在所述目标数据记录中添加数据信息,以基于所述数据信息获取所述目标数据,包括:在所述目标数据记录中添加所述数据信息,并基于所述数据信息生成音频描述信息,以基于所述音频描述信息获取所述目标数据。2CN114220410A权利要求书2/2页8.一种音频处理装置,其特征在于,所述装置包括:创建模块,用于响应于获取到待处理音频,为所述待处理音频创建目标数据记录;生成模块,用于基于所述待处理音频和所述待处理音频对应的第一歌词文件,生成目标数据,所述第一歌词文件为逐句划分的歌词文件,所述目标数据至少包括伴奏音频和第二歌词文件,所述第二歌词文件为逐字划分的歌词文件;添加模块,用于在所述目标数据记录中添加数据信息,以基于所述数据信息获取所述目标数据。9.一种计算设备,其特征在于,所述计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其