万本电子书0元读

万本电子书0元读

顶部广告

GPU编程实战(基于Python和CUDA)电子书

1.本书基于Python和CUDA介绍GPU编程 2.重介绍如何通过GPU编程来实现高性能的并行计算 3.本书为读者供习题,并以“习题提示”的方式给出解题思路 4.异步社区为读者提供配套代码

售       价:¥

纸质售价:¥39.90购买纸书

121人正在读 | 0人评论 6.4

作       者:布莱恩·图奥迈宁(Brian Tuomanen) 著

出  版  社:人民邮电出版社有限公司

出版时间:2022-06-01

字       数:21.2万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书旨在引导读者基于 Python 和CUDA 的 GPU 编程发高性能的应用程序,先后介绍了为什么要学习 GPU 编程、搭建 GPU编程环境、PyCUDA门等内容,以及 CUDA 代码的调试与性能分析、通过 Scikit-CUDA 模块使用 CUDA 库、实现深度神经网络、CUDA 性能优化等内容。学完上述内容,读者应能从零始构建基于 GPU的深度神经网络,甚至能够解决与数据科学和 GPU编程高性能计算相关的问题。 本书适合对GPU 编程与 CUDA编程感兴趣的读者阅读。读者应掌握必要的基本数学概念,且需要具备一定的 Python编程经验。<br/>【推荐语】<br/>1.本书基于Python和CUDA介绍GPU编程 2.重介绍如何通过GPU编程来实现高性能的并行计算 3.本书为读者供习题,并以“习题提示”的方式给出解题思路 4.异步社区为读者提供配套代码<br/>【作者】<br/>Brian Tuomanen 博士自2014年以来,一直从事CUDA 和GPU 编程方面的工作。他在美国西雅图华盛顿大学(University of Washington)获得了电气工程专业的学士学位,在攻读数学专业的硕士学位之前,从事过软件工程方面的工作。后来,他在哥伦比亚的密苏里大学攻读数学博士学位,在那里与 GPU 编程"邂逅"——GPU编程当时主要用于研究科学问题。Tuomanen 博十曾经在美国陆军研究实验室以GPU编程为题发表演讲,后来在美国马里兰州的一家初创公司负责GPU集成和发方面的工作。目前,他在西雅图担任微软的机器学习专家(Azure CSI)。<br/>
目录展开

版 权

版权声明

内容提要

作者简介

审稿人简介

前 言

读者对象

本书内容

阅读本书的前提

配套资源解压工具

体例格式

第1章 为什么要学习GPU编程

1.1 技术要求

1.2 并行化与阿姆达尔定律

1.3 对代码进行性能分析

1.4 小结

1.5 习题

第2章 搭建GPU编程环境

2.1 技术要求

2.2 确保拥有合适的硬件

2.3 安装GPU驱动程序

2.4 搭建C++编程环境

2.5 为GPU编程设置Python环境

2.6 小结

2.7 习题

第3章 PyCUDA入门

3.1 技术要求

3.2 查询GPU

3.3 使用PyCUDA的gpuarray类

3.4 使用PyCUDA的ElementwiseKernel执行逐元素运算

3.5 小结

3.6 习题

第4章 内核函数、线程、线程块与网格

4.1 技术要求

4.2 内核函数

4.3 线程、线程块与网格

4.4 线程同步与线程通信

4.5 并行前缀算法

4.6 小结

4.7 习题

第5章 流、事件、上下文与并发性

5.1 技术要求

5.2 CUDA设备同步

5.3 事件

5.4 上下文

5.5 小结

5.6 习题

第6章 CUDA代码的调试与性能分析

6.1 技术要求

6.2 在CUDA内核函数中使用printf函数

6.3 CUDA C编程简介

6.4 利用Nsight IDE开发和调试CUDA C代码

6.5 使用NVIDIA性能分析工具——nvprof与Visual Profiler

6.6 小结

6.7 习题

第7章 通过Scikit-CUDA模块使用CUDA库

7.1 技术要求

7.2 安装Scikit-CUDA

7.3 利用cuBLAS库处理基本线性代数运算

7.4 利用cuFFT库进行快速傅里叶变换

7.5 通过Scikit-CUDA使用cuSolver

7.6 小结

7.7 习题

第8章 CUDA设备函数库与Thrust库

8.1 技术要求

8.2 cuRAND设备函数库

8.3 CUDA Math API

8.4 CUDA Thrust库

8.5 小结

8.6 习题

第9章 实现深度神经网络

9.1 技术要求

9.2 人工神经元与神经网络

9.3 softmax层的实现

9.4 交叉熵损失函数的实现

9.5 序贯网络的实现

9.6 Iris数据集

9.7 小结

9.8 习题

第10章 应用编译好的GPU代码

10.1 通过Ctypes模块启动编译好的代码

10.2 编译并运行纯PTX代码

10.3 为CUDA Driver API编写包装器

10.4 小结

10.5 习题

第11章 CUDA性能优化

11.1 动态并行性

11.2 向量化数据类型与内存访问

11.3 线程安全的原子操作

11.4 线程束洗牌

11.5 内联PTX汇编

11.6 经过优化的数组求和函数

11.7 小结

11.8 习题

第12章 未来展望

12.1 深入了解CUDA和GPGPU编程技术

12.2 图形领域

12.3 机器学习与计算机视觉

12.4 区块链技术

12.5 小结

12.6 习题

习题提示

第1章 为什么要学习GPU编程

第2章 搭建GPU编程环境

第3章 PyCUDA入门

第4章 内核函数、线程、线程块与网格

第5章 流、事件、上下文与并发性

第6章 CUDA代码的调试与性能分析

第7章 通过Scikit-CUDA模块使用CUDA库

第8章 CUDA设备函数库与Thrust库

第9章 实现深度神经网络

第10章 应用编译好的GPU代码

第11章 CUDA性能优化

第12章 未来展望

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部