预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共72页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

CUDA基本介绍GPU的优势1.GPU高性能计算GPU/CPU架构比较延迟与吞吐量单核CPU已经走到了尽头GPU能够更好的利用摩尔定律提供的晶体管当前的单核并行计算产品架构比较硬件CPUGPUFPGA实现比较当前的GPU开发环境未来的发展趋势CUDA的硬件架构适合通用计算GTX280性能GT200框图TPCSMROPROP微架构比较执行流水线工作在通用计算模式下的GT200SM架构DUAL-Issue并发CUDA架构GPU硬件特点如何选购硬件适合的应用不适合的应用CUDA执行模型CUDA执行模型gridblockthreadgridblockthreadgridblockthreadwarpSIMT编程模型分支性能存储器模型寄存器与localmemorySharedmemoryconstantmemory,texturememory全局存储器各种存储器的延迟各存储器大小使用存储器时可能出现的问题Bankconflict合并访问CUDAAPICUDAC语言CUDA对C的扩展:函数限定符CUDA对C的扩展:函数限定符CUDA对C的扩展:变量限定符CUDA对C的扩展:变量限定符CUDA对C的扩展:变量限定符CUDA对C的扩展:变量限定符CUDA对C的扩展:kernel执行参数CUDA对C的扩展:内建变量执行参数与内建变量的作用CUDAAPICUDAAPI功能NVCC编译器NVCC编译器PTXNVCC编译器CUBINNVCC编译器CCUDAAPI库函数如何编写CUDA程序如何编写CUDA程序?优化原则:activeblock优化原则:activeblock优化原则:指令优化优化原则:存储器访问优化相关资源