人工智能与深度学习的发展得益于GPU等并行计算设备的快速发展与普及,解决了深度学习需要耗费大量计算资源的问题。目前主流的AI开发开源软件库如OpenCV、Caffe、TensorFlow、PyTorch等都提供了GPU的使用接口,使得GPU的使用越来越方便。CUDA(Compute Unified Device Architecture)即统一计算架构,是英伟达(NVIDIA)公司推出的并行计算平台。CUDA采用了一种简单的数据并行模型,再结合编程模型,从而无需操纵复杂的图形基元。CUDA极大地方便了程序员利用NVIDIAGPU进行通用计算的开发,成为当前GPU应用领域的主流开发工具。本讲介绍高性能GPU的各种计算模式,并以CUDA并行编程为例,重点介绍基于CUDA的GPU高性能计算开发方法。
www.bilibili.com