当当云阅读 > 科技 > 计算机/网络 > 软件系统 > OpenCL实战

OpenCL实战电子书

　　涵盖OpenCL v. 1.1 　　学习如何加速图形和计算　　不管你的系统如何，计算能力总有富裕，可以挖掘。OpenCL就是这样一门高性能编程语言，通过在多核CPU、图像处理器以及不同的计算设备上运行，来**发挥系统的计算能力。OpenCL非常适用于对处理速度要求很高的任务，例如矢量计算、矩阵运算以及图形加速等等。　　本书通过OpenCL将并行计算理论和高性能应用程序实践完美融合在一起。首先直观介绍基本的数据结构。然后，再引高速排序、图像处理、矩阵运算以及快速傅里叶变换等编程实例。此外，本书还对图像加速的所有重要主题做了深的介绍。大量富有挑战性的例子也让你通过不同的方面来编程实践，加深理解。

售价：¥

纸质售价：¥61.40购买纸书

147人正在读 | 2人评论

6.2

作者：[美]Matthew Scarpino 著

出版社：人民邮电出版社

出版时间：2014-07-01

字数：30.6万

所属分类：科技 > 计算机/网络 > 软件系统

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(2条)

读书简介
目录
累计评论(2条)

OpenCL(OpenComputingLanguage)是个面向异构系统通用目的并行编程的放式、免费标准，也是一个统一的编程环境。OpenCL当前已经广泛应用于各种并行环境和不同行业领域。《OpenCL实战》是OpenCL编程的实践指南，旨在介绍如何在实际的应用程序中使用OpenGL解决问题。全书共16章和4个附录。正文可以分为3个部分。部分是第1～10章，主要讨论的是OpenCL语言及其各项功能。第二部分是第11～14章，展示如何用OpenCL来处理高性能计算领域会经常碰到的大规模任务。后一部分，包括15章和16章，展示如何用OpenCL来加速OpenGL应用程序的执行。附录A介绍了SDK并演示如何安装AMD和Nvidia所提供的SDK。附录B讨论了OpenGL和着色器程序发的基础知识。附录C介绍如何安装和使用MinGW。附录D讨论了嵌式OpenCL标准。《OpenCL实战》适合于需要在异构平台和并发环境下行发的专业人士阅读，要求读者有一定的C语言基础。《OpenCL实战》也适合对OpenCL和高性能计算感兴趣的读者参考。 【推荐语】 涵盖OpenCL v. 1.1 学习如何加速图形和计算不管你的系统如何，计算能力总有富裕，可以挖掘。OpenCL就是这样一门高性能编程语言，通过在多核CPU、图像处理器以及不同的计算设备上运行，来**发挥系统的计算能力。OpenCL非常适用于对处理速度要求很高的任务，例如矢量计算、矩阵运算以及图形加速等等。本书通过OpenCL将并行计算理论和高性能应用程序实践完美融合在一起。首先直观介绍基本的数据结构。然后，再引高速排序、图像处理、矩阵运算以及快速傅里叶变换等编程实例。此外，本书还对图像加速的所有重要主题做了深的介绍。大量富有挑战性的例子也让你通过不同的方面来编程实践，加深理解。本书具有以下特色： ● 循序渐学习OpenCL； ● 大量注释详尽的代码； ● 经过测试的高性能算法。如果读者具有C或C++的编程背景，对阅读、理解本书会有所帮助，但并不需要读者之前对OpenCL有任何了解。 【作者】 Matthew Scarpino 有12年为嵌式系统发高性能应用程序的经验。他也是《Programming the Cell Processor》一书的作者。

目录展开

内容提要

前言

关于本书

读者

路线图

获取和编译示例代码

代码命名约定

作者在线

关于封面图

致谢

第一部分 OpenCL编程基础

第1章 OpenCL简介

1.1 OpenCL的来临

1.2 为什么是OpenCL

1.2.1 可移植性

1.2.2 标准化的向量处理

1.2.3 并行编程

1.3 类比：OpenCL处理和纸牌游戏

1.4 OpenCL应用程序的第一印象

1.5 OpenCL标准和扩展

1.6 框架和SDK

1.7 小结

第2章主机编程：基本的数据结构

2.1 基本数据类型

2.2 获取平台信息

2.2.1 创建平台结构

2.2.2 获取平台信息

2.2.3 示例代码：测试平台的扩展

2.3 访问安装设备

2.3.1 创建设备结构

2.3.2 获取设备信息

2.3.3 示例代码：测试设备扩展

2.4 通过上下文管理设备

2.4.1 创建上下文

2.4.2 获取上下文信息

2.4.3 上下文和引用计数

2.4.4 示例代码：检查上下文的引用计数

2.5 将设备代码保存在程序中

2.5.1 创建程序

2.5.2 编译程序

2.5.3 获取程序信息

2.5.4 示例代码：构建来自多个源文件的程序

2.6 将函数打包为内核

2.6.1 创建内核

2.6.2 获取内核信息

2.6.3 示例代码：获取内核信息

2.7 用命令队列保存内核

2.7.1 创建命令队列

2.7.2 入列内核执行命令

2.8 小结

第3章主机编程：数据传输和数据划分

3.1 设置内核参数

3.2 缓存对象

3.2.1 分配缓存对象

3.2.2 创建子缓存对象

3.3 图像对象

3.3.1 创建图像对象

3.3.2 获取图像对象的相关信息

3.4 获取缓存对象的相关信息

3.5 内存对象的传输命令

3.5.1 读/写数据传输

3.5.2 映射内存对象

3.5.3 内存对象间的数据复制

3.6 数据划分

3.6.1 循环和工作项

3.6.2 工作项的大小和偏移量

3.6.3 一个简单的一维例子

3.6.4 工作组和计算单元

3.7 小结

第4章内核编程：数据类型和设备内存

4.1 内核编程简介

4.2 标量数据类型

4.2.1 访问双精度数据类型

4.2.2 字节顺序

4.3 浮点计算

4.3.1 浮点数据类型

4.3.2 双转度数据类型

4.3.3 half数据类型

4.3.4 检查IEEE-754的兼容性

4.4 向量数据类型

4.4.1 首选向量宽度

4.4.2 初始化向量

4.4.3 读取和修改向量分量

4.4.4 字节顺序和内存访问

4.5 OpenCL设备模型

4.5.1 内核模型类比的第一部分：学校中学数学的学生

4.5.2 设备模型类比的第二部分：设备上的工作项

4.5.3 程序中的地址空间

4.5.4 内存对齐

4.6 局部和私有内核参数

4.6.1 局部参数

4.6.2 私有参数

4.7 小结

第5章内核编程：运算符和函数

5.1 运算符

5.2 工作组和工作项函数

5.2.1 维度和工作项

5.2.2 工作组

5.2.3 示例应用

5.3 数据传输操作

5.3.1 加载和保存同类型的数据

5.3.2 将标量数组加载保存到向量中

5.3.3 将向量保存到标量数组中

5.4 浮点型函数

5.4.1 算术运算函数和取舍函数

5.4.2 比较函数

5.4.3 指数函数和对数函数

5.4.4 三角函数

5.4.5 其他类型的浮点函数

5.5 整数函数

5.5.1 加法函数和减法函数

5.5.2 乘法运算

5.5.3 其他类型的整数函数

5.6 混洗和选择函数

5.6.1 混洗函数

5.6.2 选择函数

5.7 向量测试函数

5.8 几何函数

5.9 小结

第6章图像处理

6.1 图像对象和采样器

6.1.1 主机上的图像对象：cl_mem

6.1.2 主机上的采样器；cl_sampler

6.1.3 设备上的图像对象：image2d_t和image3d_t

6.1.4 设备上的采样器：sampler_t

6.2 图像处理函数

6.2.1 图像读取函数

6.2.2 写图像函数

6.2.3 图像信息函数

6.2.4 一个简单的例子

6.3 图像放缩和插值

6.3.1 最邻近插值

6.3.2 双线性插值

6.3.3 用OpenCL编程放大图像

6.4 小结

第7章事件、性能分析及同步化

7.1 主机提醒事件

7.1.1 将事件和命令关联

7.1.2 将事件和回调函数作关联

7.1.3 主机提醒的例子

7.2 命令同步事件

7.2.1 等待列表和命令事件

7.2.2 等待列表和用户事件

7.2.3 额外的命令同步函数

7.2.4 获取和事件关联的数据

7.3 性能分析事件

7.3.1 配置性能分析命令

7.3.2 对数据传输进行性能分析

7.3.3 对数据划分进行分析

7.4 工作项同步化

7.4.1 障碍和栅栏

7.4.2 原子操作

7.4.3 原子命令和互斥

7.4.4 异步数据传输

7.5 小结

第8章用C++开发

8.1 初步了解

8.1.1 向量和字符串

8.1.2 异常

8.2 创建内核

8.2.1 平台、设备以及上下文

8.2.2 程序和内核

8.3 内核参数和内存对象

8.3.1 内存对象

8.3.2 通用数据参数

8.3.3 局部内存参数

8.4 命令队列

8.4.1 创建CommandQueue对象

8.4.2 入列内核执行命令

8.4.3 读写命令

8.4.4 内存映射和复制命令

8.5 事件处理

8.5.1 主机提醒

8.5.2 命令同步化

8.5.3 性能分析事件

8.5.4 另外的事件函数

8.6 小结

第9章用Java和Python来开发

9.1 Aparapi

9.1.1 Aparapi安装

9.1.2 Kernel类

9.1.3 工作项和工作组

9.2 JavaCL

9.2.1 JavaCL安装

9.2.2 JavaCL开发概述

9.2.3 用JavaCL来创建内核

9.2.4 设定内核参数以及入列命令

9.3 PyOpenCL

9.3.1 PyOpenCL安装和许可

9.3.2 PyOpenCL开发概述

9.3.3 用PyOpenCL创建内核

9.3.4 设置参数和执行内核

9.4 小结

第10章通用编程原则

10.1 全局大小和局部大小

10.1.1 找出工作组大小的上限值

10.1.2 测试内核和设备

10.2 数值归并

10.2.1 OpenCL的归并算法

10.2.2 使用向量提升归并运算的速度

10.3 工作组间的同步化

10.4 设计高性能内核的10条技巧

10.5 小结

第二部分用OpenCL来编程实现实际的算法

第11章归并与排序

11.1 MapReduce

11.1.1 MapReduce简介

11.1.2 MapReduce和OpenCL

11.1.3 MapReduce例子：字符串查找

11.2 双调排序

11.2.1 理解双调排序算法

11.2.2 用OpenCL来实现双调排序

11.3 基数排序

11.3.1 理解基数排序

11.3.2 用向量实现基数排序

11.4 小结

第12章矩阵和QR分解

12.1 矩阵转置

12.1.1 矩阵简介

12.1.2 矩阵转置的理论和实现

12.2 矩阵乘法

12.2.1 矩阵乘法理论

12.2.2 用OpenCL编程实现矩阵乘法

12.3 Householder变换

12.3.1 向量投影

12.3.2 向量反射

12.3.3 外积和Householder矩阵

12.3.4 用OpenCL编程实现向量反射

12.4 QR分解

12.4.1 计算Householder向量和R矩阵

12.4.2 计算Householder矩阵和矩阵Q

12.4.3 用OpenCL编程实现QR分解

12.5 小结

第13章稀疏矩阵

13.1 差分方程和稀疏矩阵

13.2 稀疏矩阵的存储以及Harwell-Boeing数据集

13.2.1 Harwell-Boeing数据集简介

13.2.2 访问Matrix Market文件中的数据

13.3 最速下降法

13.3.1 正定矩阵

13.3.2 最速下降法理论

13.3.3 用OpenCL编程实现SD算法

13.4 共轭梯度法

13.4.1 正交化和共轭

13.4.2 正交化和GRAM-SCHMIDT法

13.4.3 共轭梯度法

13.5 小结

第14章信号处理和快速傅里叶变换

14.1 频率分析简介

14.2 离散傅里叶变换

14.2.1 DFT背后的理论

14.2.2 OpenCL和DFT

14.3 快速傅里叶变换

14.3.1 DFT的三条性质

14.3.2 构建快速傅里叶变换

14.3.3 用OpenCL来实现FFT

14.4 小结

第三部分用OpenCL来加速OpenGL

第15章将OpenCL和OpenGL结合

15.1 在OpenGL和OpenCL之间共享数据

15.1.1 创建OpenCL上下文

15.1.2 在OpenGL和OpenCL之间共享数据

15.1.3 同步化对共享数据的访问

15.2 获取信息

15.2.1 获取OpenGL对象和纹理信息

15.2.2 获取OpenGL上下文的相关信息

15.3 基本的互操作例子

15.3.1 初始化OpenGL操作

15.3.2 初始化OpenCL操作

15.3.3 创建数据对象

15.3.4 执行内核

15.3.5 渲染图形

15.4 互操作和动画

15.4.1 确定顶点数据

15.4.2 动画和显示

15.4.3 执行内核

15.5 小结

第16章纹理和渲染缓存

16.1 图像滤波

16.1.1 高斯模糊

16.1.2 图像锐化

16.1.3 图像浮雕化

16.2 用OpenCL来对纹理滤波

16.2.1 init_gl函数

16.2.2 init_cl函数

16.2.3 configure_shared_data函数

16.2.4 execute_kernel函数

16.2.5 display函数

16.3 小结

附录A 安装和使用软件开发包

A.1 了解OpenCL SDK

A.1.1 检查设备的兼容性

A.1.2 OpenCL头文件和库文件

A.2 Windows上的OpenCL

A.2.1 在Windows上安装AMD显卡驱动

A.2.2 用AMD显卡来编译Windows应用程序

A.2.3 在Windows上安装Nvidia的显卡驱动

A.2.4 用Nvidia显卡来编译Windows应用程序

A.3 Linux上的OpenCL

A.3.1 在Linux上安装AMD的显卡驱动

A.3.2 在Linux上安装Nvidia显卡驱动

A.3.3 在Linux上编译OpenCL应用程序

A.4 在Mac OS上安装OpenCL

A.5 小结

附录B 用OpenGL作实时渲染

B.1 安装OpenGL

B.1.1 在Windows上安装OpenGL

B.1.2 在Linux上安装OpenGL

B.1.3 在Mac OS上安装OpenGL

B.2 在主机上开发OpenGL应用程序

B.2.1 将数据放到顶点缓存对象（VBO）之中

B.2.2 配置顶点属性

B.2.3 编译和部署着色器

B.2.4 启动渲染过程

B.3 开发着色器程序

B.3.1 着色器编程简介

B.3.2 顶点着色器

B.3.3 片段着色器

B.4 用GLUT来创建OpenGL窗口

B.4.1 配置和创建窗口

B.4.2 事件处理

B.4.3 显示窗口

B.5 将OpenGL和GLUT结合

B.5.1 GLUT/OpenGL初始化

B.5.2 设置视窗（viewport）

B.5.3 渲染模型

B.6 添加纹理

B.6.1 在主机应用程序中创建纹理

B.6.2 顶点着色器中的纹理映射

B.6.3 在片段着色器中使用纹理

B.7 小结

附录C 面向Windows和OpenCL的最简GNU

C.1 在Windows下安装MinGW

C.1.1 获取并运行图形安装工具

C.1.2 在MinGW下安装新工具

C.2 编译MinGW可执行程序

C.2.1 用MinGW编译Hello World!

C.2.2 GNU编译器

C.3 Makefiles

C.3.1 GNU makefile的结构

C.3.2 目标和伪目标

C.3.3 简单的makefile例子

C.4 编译OpenCL应用程序

C.5 小结

附录D Appendix D移动设备上的OpenCL

D.1 数值处理

D.2 图像处理

D.3 小结

累计评论(2条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

发表评论

买过这本书的人还买过

读了这本书的人还在读

支持设备

OpenClaw实战100个精品案例:打造你的数字分身￥39.99

张有鱼编著

￥39.99

AI全工具提效应用到精通指南￥19.99

乔剑、苏小文、刘源

￥19.99

7小时精通剪映:短视频剪辑/调色/*/字幕(手机版+电脑版)(全彩) ￥55.30

刘畅

￥55.30

你好,AI:智能时代职场生存指南(为现代职场人量身打造的AI实用指南) ￥29.00

起行(杭州)文化科技有限公司

￥29.00

OpenClaw:从入门到精通应用操作大全￥19.99

乔剑、林知远、刘源

￥19.99

你好,AI:deepseek实操宝典(20余种AI工具、11种学习法、10大应用场景、108个实操案例) ￥58.00

憨爸、胡斌、起行(杭州)文化科技有限公司

￥58.00

Claude Code实战:Harness工程之道￥51.07

黄佳

￥51.07

脑机接口￥15.99

郭亮著

￥15.99

AI短视频生成与制作￥49.80

王雪乃著

￥49.80

AI时代,学什么,怎么学￥17.99

和渊著

￥17.99

更多同类图书 >

OpenCL实战电子书

支持设备

OpenClaw实战100个精品案例:打造你的数字分身 ￥39.99

AI全工具提效应用到精通指南 ￥19.99

7小时精通剪映:短视频剪辑/调色/*/字幕(手机版+电脑版)(全彩) ￥55.30

你好,AI:智能时代职场生存指南(为现代职场人量身打造的AI实用指南) ￥29.00

OpenClaw:从入门到精通应用操作大全 ￥19.99

你好,AI:deepseek实操宝典(20余种AI工具、11种学习法、10大应用场景、108个实操案例) ￥58.00

Claude Code实战:Harness工程之道 ￥51.07

脑机接口 ￥15.99

AI短视频生成与制作 ￥49.80

AI时代,学什么,怎么学 ￥17.99

当当云阅读