预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115509764A(43)申请公布日2022.12.23(21)申请号202211397246.8(22)申请日2022.11.09(71)申请人湖南马栏山视频先进技术研究院有限公司地址410000湖南省长沙市开福区鸭子铺路1号146房4室(72)发明人邓正秋吕绍和(74)专利代理机构长沙伊柏专利代理事务所(普通合伙)43265专利代理师罗莎(51)Int.Cl.G06F9/50(2006.01)G06T1/20(2006.01)权利要求书3页说明书14页附图3页(54)发明名称一种实时渲染的多GPU并行调度方法、装置及存储器(57)摘要本发明公开了一种实时渲染的多GPU并行调度方法、装置及存储器,其包括如下步骤:S1、获取渲染任务,并对渲染任务中的待渲染场景模型文件中的待渲染场景资产进行模型变换以及视口变换以确定各个物体资产的输出像素区域,并根据所述输出像素区域确定待渲染任务的渲染任务量;S2、获取GPU的渲染能力向量;S3、根据所述GPU渲染能力向量以及待渲染任务的渲染任务量对渲染任务进行切分,随后任务发送到对应GPU进行渲染。本发明能够根据渲染区域之间的渲染任务量差异,进行合适的任务切分从而提升并行效率减少各个GPU之间的输出时间差。CN115509764ACN115509764A权利要求书1/3页1.一种实时渲染的多GPU并行调度方法,其特征在于:包括如下步骤:S1、获取渲染任务,并对渲染任务中的待渲染场景模型文件中的待渲染场景资产进行模型变换以及视口变换以确定各个物体资产的输出像素区域,并根据所述输出像素区域确定待渲染任务的渲染任务量,其中分别代表构建几何体、构建粒子数、构建光照数据、纹理编码数;S2、获取GPU的渲染能力向量,所述GPU的渲染能力向量通过单位时间内所构建的几何体数目、单位时间内所编码的纹理、单位时间内所构建的光照数据、单位时间内所构建的粒子数目进行量化;S3、根据所述GPU渲染能力向量以及待渲染任务的渲染任务量对渲染任务进行切分,随后任务发送到对应GPU进行渲染。2.根据权利要求1所述的方法,其特征在于:待渲染任务的渲染任务量,其中分别代表渲染方块区域右上角坐标以及左下角坐标;其中f为渲染任务度量算子。3.根据权利要求2所述的方法,其特征在于:所述S1具体为:S10、扫描场景文件确定场景内的资产数目,并初始化资产链表数组L,其长度为N_a表示资产数目;S11、初始化其中表示链表数组索引;S12、对L[i]内的资产确定其模型坐标系空间与输出屏幕空间之间的映射关系,然后对该资产执行模型变换,以确定其在二维输出屏幕空间的像素区域并将其写入资产链表数组L[i];S13、令i=i+1;S14、判断i是否小于N_a,若是,则返回S13,若否,则执行S15;S15、对每个输出像素计算其深度信息,以确定物体遮挡关系,在物体有重叠的像素位置,保留深度信息最小的资产剔除其余物体模型,以此为基准对资产输出像素区域进行更新;S16、根据链表生成渲染任务度量算子,其中分别代表渲染方块区域右上角坐标以及左下角坐标,分别代表构建几何体、构建粒子数、构建光照数据、纹理编码数;具体计算方法如下:S161、遍历链表数组L确定所输入方块区域所覆盖的资产数目;S162、将所覆盖的资产的渲染任务向量叠加。4.根据权利要求2所述的方法,其特征在于:所述步骤S3中“根据所述GPU渲染能力向量以及待渲染任务的任务量对渲染任务进行切分”具体为:根据待渲染任务的任务量2CN115509764A权利要求书2/3页以及GPU数目num对所述待渲染任务进行划分建立N叉树,其中所述N叉树的叶子节点的渲染任务量均小于一渲染任务量阈值向量;并遍历N叉树的叶结点,将叶结点所对应的区域分配到相应的GPU进行渲染。5.根据权利要求4所述的方法,其特征在于:所述“根据待渲染任务量以及GPU数目num对所述待渲染任务进行划分建立N叉树,其中所述N叉树的叶子节点的渲染任务量均小于一渲染任务量阈值向量”具体为:S31、初始化渲染任务阈值向量;阈值向量确定方法如下:S311、获取待渲染任务的渲染任务量;S312、读取GPU数量;S313、令渲染任务阈值向量等于;其中k为正整数;S32、对给定渲染区域进行N等分并计算所划分区域的渲染任务向量;S33、对划分的渲染区域重复执行步骤32中的操作,直到划分区域渲染任务向量各个单元皆小于设定的任务阈值向量。6.根据权利要求5所述的方法,其特征在于:遍历N叉树的叶结点,将叶结点所对应的区域分配到相应的GPU进行渲染具体为:S34、根据渲染区域的渲染任务度量算子,以及GPU渲染能力值初始化代价矩阵,其中代表矩阵,代表第i号GPU渲染第j个N叉树的叶结点区域所需要的时间,代表N叉