预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN103049927A*(12)发明专利申请(10)申请公布号CN103049927A(43)申请公布日2013.04.17(21)申请号201310017768.5(22)申请日2013.01.17(71)申请人浙江大学地址310027浙江省杭州市西湖区浙大路38号(72)发明人赵磊张勤飞任艳姣陆胜李伟(74)专利代理机构杭州天勤知识产权代理有限公司33224代理人胡红娟(51)Int.Cl.G06T15/06(2011.01)权利要求书权利要求书11页页说明书说明书44页页(54)发明名称基于GPU集群的实时光线跟踪渲染方法(57)摘要本发明公开了一种基于GPU集群的实时光线跟踪渲染方法,包括如下步骤:预先将要渲染的每帧任务以屏幕空间上划分成若干的子任务;利用动态负载均衡机制将子任务分配到集群中的各个渲染机器节点上;利用GPU在每个渲染节点内部并行地对每个子任务的屏幕空间每个像素进行并行光线跟踪计算;在各个渲染节点上的子任务渲染完成后,发送中间图像给管理机器节点,管理机器节点在接收到所有子任务的渲染结果图像后,将所有子任务的渲染结果图像拼接成最终的结果图像。本发明通过GPU高并行地来进行光线跟踪计算,同时使用极坐标表示方式进行点和三角面片的求交运算,在得到真实感效果画面的同时,得到了非常好的渲染性能,满足了应用的实时需求。CN1034927ACN103049927A权利要求书1/1页1.一种基于GPU集群的实时光线跟踪渲染方法,其特征在于,包括如下步骤:1)将要渲染的每帧任务预先以屏幕空间的方式划分成若干的子任务;2)利用动态负载均衡机制将子任务分配到集群中的各个渲染机器节点上;3)在每个渲染机器节点内部利用GPU并行地对每个子任务的屏幕空间每个像素进行计算光线跟踪;4)在各个渲染机器节点上的子任务完成后,发送中间图像给管理机器节点,管理机器节点在接收到所有子任务的渲染结果图像后,将所有子任务的渲染结果图像拼接成最终的结果图像。2.根据权利要求1所述的基于GPU集群的实时光线跟踪渲染方法,其特征在于,步骤1)中以屏幕空间的方式划分子任务时将每帧任务的像素区域划分成若干相互独立的子像素区域,一个要渲染的子任务对应一个子像素区域。3.根据权利要求1所述的基于GPU集群的实时光线跟踪渲染方法,其特征在于,步骤2)中首先初始化任务,将首帧的所有子任务均等的分配到各个渲染机器节点。4.根据权利要求3所述的基于GPU集群的实时光线跟踪渲染方法,其特征在于,首帧的所有子任务渲染完成后,每个渲染节点上的子任务量被动态调整,使每个渲染节点的渲染传输时间尽量相等。5.根据权利要求4所述的基于GPU集群的实时光线跟踪渲染方法,其特征在于,每个渲染节点上的渲染任务量的动态调整过程:管理机器节点记录每个渲染机器节点完成子任务的计算时间以及任务数,当首帧的所有子任务计算结束后,管理机器节点会根据每个渲染节点的计算能力进行动态地调整,在后续帧子任务的分配时,性能差的渲染节点会分配到较少的子任务数,性能高的渲染节点会分配到较多的任务数,使每个渲染机器节点的渲染时间尽可能相等。6.根据权利要求5所述的基于GPU集群的实时光线跟踪渲染方法,其特征在于,每个渲染机器节点内每次子任务的流程:初始化场景同时构建和生成PKD树,PKD树的每个叶子节点是一个子任务和该子任务的渲染机器标号以及计算时间;在显存中根据分配到的子任务大小申请一块存储区;对子任务中屏幕空间每个像素,在GPU上启动一个线程执行光线跟踪运算,结果保存在显存里;渲染完成后读取显存数据并发送给管理机器节点。2CN103049927A说明书1/4页基于GPU集群的实时光线跟踪渲染方法技术领域[0001]本发明涉及集群渲染中的一种渲染方法,特别涉及一种基于GPU集群的实时光线跟踪渲染方法。背景技术[0002]目前,高真实感渲染已经被广泛地应用在电影特效制作、虚拟现实展示、文化遗产交互导览等领域。高真实感渲染需要很强的计算能量,随着三维场景或者模型的复杂度的提高(当前,几个G大小的三维场景已经很常见),单机上进行高真实感的实时渲染几乎不可能。利用集群技术来解决这个问题是目前最常用的方法。[0003]目前主要的渲染方法主要有光线跟踪渲染和光栅化渲染,其他的渲染如辐射度等。光栅化的渲染方法是目前使用最广泛的渲染方法,也是最基础的方法,其特点是渲染效率高,真实感不强。但是,该方法是一种串行的渲染方法,尽管可以利用机器CPU之间的并行,但是不能利用GPU内部的并行计算能力;而且光栅化渲染效果存在严重不足,比如对阴影、折射、反射等的支持都要耗费很长的时间,无法满足实时的应用要求。[0004]辐射度方法在效果上表现较好,但该方法计算量非常大,不能够满足实时应用需求。光线跟踪的渲染