预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

MainMenuID:1202 应用图形处理器提速地震叠前时间偏移的实现方法 李博*刘国峰刘洪 (中国科学院地质与地球物理研究所,北京100029) 摘要新近发展的图形处理器(GraphicProcessingUnit:GPU)通用计算技术,现已日趋实用成型, 并获得诸多应用领域的广泛关注。对油气勘探的专项资料处理技术的运用而言,概因GPU与中 央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技术在石油工业中的应用研究 正在有效开展。本文仅借助于油气勘探中广泛使用的叠前时间偏移,旨在于扼要阐明其基于GPU 应用的有效性;文中还提出一种利用GPU实现地震叠前时间偏移的软件构件方法,并针对非对 称走时叠前时间偏移所拓展的应用软件提供一种具体实现架构。与以往用个人计算机(Personal Computer:PC)机或者PC集群所用的叠前时间偏移相比,本文方法可甚大地提高计算效率,从 而在石油物探资料处理中可显著地节约计算成本和维护费用。文中实际例证也表明,基于GPU 进行高性能并行计算,当是适应目前石油工业中大规模计算需求的一个重要发展途径。 关键词非对称走时叠前时间偏移图形处理器GPU通用计算统一计算设备架 1引言2GPU计算的优势 近十年来,将单机计算快速地推进为基于GPU的通用计算(GPGPU:General 大规模的机群(PC-Cluster)并行计算,PurposeGPU)已可利用图形卡进行一般性 是一种业绩卓著的探索历程标志。从中我的计算,从而摆脱了以往仅能用于图像绘制 们也进而认识到,若仅单凭依靠增加计算的局限。GPU的浮点运算能力现已可达每秒 节点的数量和单个节点的计算能力,试图万亿次级别,即相当于X86处理器的数十倍。 借以提高计算能力的思路必将耗资甚巨。但是,GPU本身毕竟并非通用芯片,只能通 实践业已表明,在常规机群系统上进过图形应用程序接口(API)来进行3D渲染 行三维海量数据的叠前时间偏移,仍然是等专项作业,因而自身尚无法直接用以进行 甚费机时,从而在计算成果的产出时间与通用计算。GPU通用计算技术的出现,旨在 生产进度需求之间,时常产生严重脱节的于直接利用GPU的强大计算能力,用以完成 局面。提速通用的计算作业。其动力来自GPU自身 值得庆幸的是,在机群并行计算系统所具有的高度的并行性和高密集的运算优 飞速发展的同时,基于GPU的通用计算技势。相对于GPU而言,CPU则因主要针对复 术也日趋成型。以2001年NVIDIA公司推杂控制和低延迟环境而设计的,这就使得它 出可用以编程的GPU芯片为标志[1],至今的运算单元个数偏少,且带宽也不足;而GPU 已发展为可内建960多个流处理器的高效本身就是一个单指令多数据流(SIMD)的流 计算芯片。随着GPU本身可编程性和灵活处理器,拥有众多的运算单元和强悍的外部 性的增强以及所呈现的强大的浮点处理能存储器带宽,因此具备了更加适用于高并行 力,目前利用GPU做通用计算已成为必然性和高密集度数值计算的巨大潜能。至此不 的发展趋势。难想象,GPU的这些优势所在,值得拓展并 CPS/SEGBeijing2009InternationalGeophysicalConference&Exposition 将之推广应用于油气工业。上的介质视为水平层状介质,此类走时难以 用简单的显函数表达,故在成像计算中不便 3叠前时间偏移的走时计算应用。若改由利用射线追踪的数值方法来计 算走时,则存在累计误差、稳定性以及计算 众所周知,实现叠前时间偏移的一个关效率低的问题。Taner&Koehler1969年根 键环节是计算地震波走时,所用算法大致可据均匀介质中的时距关系和函数逼近理论, 分三类,即直射线、弯曲射线以及非对称走推出水平层状介质中的时距关系表达的算 时计算。直射线走时算法的模型是均匀介法,已在生产实际中广泛应用,具体形式如 质。通常的弯曲射线走时计算是将成像点以下,即 m 222246k TcRTcRcRcR==+++∑k+10234LL(1) k=0 式中R222=+xy。上述两类走时计算都不以及拟微分算子的象征理论[8],针对横向变 涉及介质速度横向变化的情况。刘洪于2007速介质得出走时计算表达中应包含有奇次 年基于冯康的保结构算法的思想,利用李群项[2-4]: mi 22jij− TT=+0,∑∑cxyji−j ij==22 2223223 =+Tcxy02,0()(++cxcxycxycy3,02,11,20,3+++)(2) 4322134 +++()c4,0xcxyc3,12,2xy+cxy1,3+c0,4yLL 这样就形成一类非对称的走时的李代数积网络传输过程,由于每个线程都可以访问同 分算法,从而摆脱