预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115426611A(43)申请公布日2022.12.02(21)申请号202210907370.8(22)申请日2022.07.29(71)申请人赛因芯微(北京)电子科技有限公司地址100011北京市朝阳区雅宝路12号华声大厦1906(72)发明人吴健(74)专利代理机构北京睿阳联合知识产权代理有限公司11758专利代理师孙磊(51)Int.Cl.H04S7/00(2006.01)H04S3/00(2006.01)权利要求书2页说明书7页附图3页(54)发明名称利用元数据对基于对象的音频进行渲染的方法及装置(57)摘要本申请提供一种利用元数据对基于对象的音频进行渲染的方法及装置,该方法包括基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;通过所述类型标签,引用音频块格式以及在额外数据中收集的通用数据,生成音频模型的对象类型的元数据对象;通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数和对象类型的元数据对象,生成对象类型的渲染项。本申请提供一种利用元数据对基于对象的音频进行渲染的方法,每个通道(或对象)代表声音场景中的单个声音,通过许多不同的对象来构建整个声音场景。CN115426611ACN115426611A权利要求书1/2页1.一种利用元数据对基于对象的音频进行渲染的方法,其特征在于,包括:基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;通过所述类型标签,引用音频块格式以及在额外数据中收集的通用数据,生成音频模型的对象类型的元数据对象;通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数和对象类型的元数据对象,生成对象类型的渲染项;所述对象类型的渲染项用于指示一个单独的音频通道格式或一组音频通道格式。2.根据权利要求1所述的方法,其特征在于,所述基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构包括:将通用数据合并为额外数据;所述通用数据包括音频对象开始时间、对象持续时间、屏幕参考和通道频率;或者,将重要数据存储在重要性数据结构中;所述重要数据包括音频对象和音频包。3.根据权利要求1所述的方法,其特征在于,所述基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构包括:将音频样本引用和封装在音轨规格结构中,并将其定义为音频样本源。4.根据权利要求3所述的方法,其特征在于,所述将音频样本引用和封装在音轨规格结构中,并将其定义为音频样本源的步骤包括:直接音轨规格将指定应直接从指定的输入轨迹读取音频样本;或者,静音音轨规格将规定所有音频样本为预设阈值。5.根据权利要求1、2或3任一所述的方法,其特征在于,所述通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数和对象类型的元数据对象,生成对象类型的渲染项具体包括:引用元数据对象、存储在重要性数据结构中的重要数据和封装音轨规格结构输入的音频样本。6.根据权利要求1、2或3任一所述的方法,其特征在于,所述通过所述类型标签,引入保存在各自的数据结构所述音频信号的对象类型的元数据,生成对应的渲染项还包括:将所述对象类型的元数据对象与音频样本源和在额外数据中收集的通用数据相关联。7.一种利用元数据对基于对象的音频进行渲染的装置,其特征在于,包括:保存模块,用于基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;生成模块,用于通过所述类型标签,引用音频块格式以及在额外数据中收集的通用数据,生成音频模型的对象类型的元数据对象;引入生成模块,用于通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数和对象类型的元数据对象,生成对象类型的渲染项;对象类型的渲染项用于指示一个单独的音频通道格式或一组音频通道格式。8.一种电子设备,其特征在于,包括:存储器以及一个或多个处理器;所述存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实2CN115426611A权利要求书2/2页现如权利要求1‑7任一项所述的方法。9.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器实现如权利要求1‑7任一项所述方法。3CN115426611A说明书1/7页利用元数据对基于对象的音频进行渲染的方法及装置技术领域[0001]本申请涉及音频处理的技术领域,尤其涉及一种利用元数据对基于对象的音频进行渲染的方法及装置。背景技术[0002]随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器