1.本书基于Python和CUDA介绍GPU编程 2.重介绍如何通过GPU编程来实现高性能的并行计算 3.本书为读者供习题,并以“习题提示”的方式给出解题思路 4.异步社区为读者提供配套代码
售 价:¥
纸质售价:¥39.90购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
版 权
版权声明
内容提要
作者简介
审稿人简介
前 言
读者对象
本书内容
阅读本书的前提
配套资源解压工具
体例格式
第1章 为什么要学习GPU编程
1.1 技术要求
1.2 并行化与阿姆达尔定律
1.3 对代码进行性能分析
1.4 小结
1.5 习题
第2章 搭建GPU编程环境
2.1 技术要求
2.2 确保拥有合适的硬件
2.3 安装GPU驱动程序
2.4 搭建C++编程环境
2.5 为GPU编程设置Python环境
2.6 小结
2.7 习题
第3章 PyCUDA入门
3.1 技术要求
3.2 查询GPU
3.3 使用PyCUDA的gpuarray类
3.4 使用PyCUDA的ElementwiseKernel执行逐元素运算
3.5 小结
3.6 习题
第4章 内核函数、线程、线程块与网格
4.1 技术要求
4.2 内核函数
4.3 线程、线程块与网格
4.4 线程同步与线程通信
4.5 并行前缀算法
4.6 小结
4.7 习题
第5章 流、事件、上下文与并发性
5.1 技术要求
5.2 CUDA设备同步
5.3 事件
5.4 上下文
5.5 小结
5.6 习题
第6章 CUDA代码的调试与性能分析
6.1 技术要求
6.2 在CUDA内核函数中使用printf函数
6.3 CUDA C编程简介
6.4 利用Nsight IDE开发和调试CUDA C代码
6.5 使用NVIDIA性能分析工具——nvprof与Visual Profiler
6.6 小结
6.7 习题
第7章 通过Scikit-CUDA模块使用CUDA库
7.1 技术要求
7.2 安装Scikit-CUDA
7.3 利用cuBLAS库处理基本线性代数运算
7.4 利用cuFFT库进行快速傅里叶变换
7.5 通过Scikit-CUDA使用cuSolver
7.6 小结
7.7 习题
第8章 CUDA设备函数库与Thrust库
8.1 技术要求
8.2 cuRAND设备函数库
8.3 CUDA Math API
8.4 CUDA Thrust库
8.5 小结
8.6 习题
第9章 实现深度神经网络
9.1 技术要求
9.2 人工神经元与神经网络
9.3 softmax层的实现
9.4 交叉熵损失函数的实现
9.5 序贯网络的实现
9.6 Iris数据集
9.7 小结
9.8 习题
第10章 应用编译好的GPU代码
10.1 通过Ctypes模块启动编译好的代码
10.2 编译并运行纯PTX代码
10.3 为CUDA Driver API编写包装器
10.4 小结
10.5 习题
第11章 CUDA性能优化
11.1 动态并行性
11.2 向量化数据类型与内存访问
11.3 线程安全的原子操作
11.4 线程束洗牌
11.5 内联PTX汇编
11.6 经过优化的数组求和函数
11.7 小结
11.8 习题
第12章 未来展望
12.1 深入了解CUDA和GPGPU编程技术
12.2 图形领域
12.3 机器学习与计算机视觉
12.4 区块链技术
12.5 小结
12.6 习题
习题提示
第1章 为什么要学习GPU编程
第2章 搭建GPU编程环境
第3章 PyCUDA入门
第4章 内核函数、线程、线程块与网格
第5章 流、事件、上下文与并发性
第6章 CUDA代码的调试与性能分析
第7章 通过Scikit-CUDA模块使用CUDA库
第8章 CUDA设备函数库与Thrust库
第9章 实现深度神经网络
第10章 应用编译好的GPU代码
第11章 CUDA性能优化
第12章 未来展望
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜