为你推荐

内容简介
前言
第1章 计算机体系结构
1.1 不同类型的并行
1.1.1 重叠、并发和并行
1.1.2 算术逻辑单元中的空间并行与时间并行
1.1.3 并行与内存
1.2 存储设备体系结构
1.2.1 多体交错式内存
1.2.2 多级存储
1.2.3 分布式存储
1.3 混合体系结构
1.3.1 GPU加速器
1.3.2 混合计算机
第2章 并行化与编程模型
2.1 并行化
2.2 性能指标
2.2.1 并行度
2.2.2 负载平衡
2.2.3 粒度
2.2.4 可扩展性
2.3 数据并行
2.3.1 循环
2.3.2 依赖性
2.3.3 依赖性示例
2.3.4 归约运算
2.3.5 嵌套循环
2.3.6 OpenMP
2.4 案例分析:向量化
2.4.1 向量计算机和向量化
2.4.2 依赖性
2.4.3 归约运算
2.4.4 流水线运算
2.5 消息传递
2.5.1 消息传递编程
2.5.2 并行环境管理
2.5.3 点对点通信
2.5.4 聚合通信
第3章 并行算法概念
3.1 并行循环算法
3.1.1 归约算法的基本原理
3.1.2 归约算法的开销和稳定性
3.1.3 循环归约
3.2 矩阵乘法的数据分布
3.2.1 行算法和列算法
3.2.2 分块算法
3.2.3 分布式算法
3.2.4 算法实现
第4章 矩阵计算基础
4.1 线性代数回顾
4.1.1 向量空间、点积、正交投影
4.1.2 线性映射与矩阵
4.2 矩阵性质
4.2.1 特殊矩阵、特征值、特征向量
4.2.2 矩阵范数
4.2.3 基变换
4.2.4 矩阵的条件数
第5章 稀疏矩阵
5.1 稀疏矩阵的起源
5.2 稀疏矩阵的并行构建:共享存储
5.3 稀疏矩阵的分块并行构建:分布式存储
第6章 用LU分解法求解线性方程组
6.1 线性方程组求解
6.1.1 直接法
6.1.2 迭代法
6.2 LU分解的原理
6.3 高斯消元法
6.4 高斯-若尔当消元法
6.5 对称矩阵的Crout分解和楚列斯基分解
第7章 稠密矩阵LU分解的并行化
7.1 分块分解
7.2 在MPI编程环境中实现分块分解
7.3 前向-后向替换法的并行化
第8章 稀疏矩阵的LU分解
8.1 分解后的矩阵结构
8.2 符号分解与重新编号
8.3 消去树
8.4 消去树与依赖性
8.5 嵌套剖分
8.6 前向-后向替换
第9章 对称正定矩阵的Krylov法
9.1 Krylov子空间基础
9.1.1 Krylov子空间
9.1.2 Arnoldi基的构建
9.2 对称矩阵Lanczos基的构建
9.3 Lanczos法
9.4 共轭梯度法
9.5 与梯度法的对比
9.6 对称正定矩阵的预处理
第10章 任意矩阵的正交化方法
10.1 GMRES法
10.2 面向对称矩阵的MINRES法
10.3 ORTHODIR法
10.4 非对称矩阵的预处理
第11章 非对称矩阵的双正交化方法
11.1 非对称矩阵双正交基的构建
11.2 非对称Lanczos法
11.3 双共轭梯度法
11.4 准极小残量法
11.5 稳定双共轭梯度法
第12章 Krylov法的并行化
12.1 稠密矩阵-向量乘法的并行化
12.2 稀疏矩阵-向量乘法:按顶点划分
12.3 稀疏矩阵-向量乘法:按元素划分
12.3.1 区域分解原理概述
12.3.2 矩阵-向量乘法
12.3.3 数据通信
12.4 点积的并行化
12.5 Krylov法的并行化小结
第13章 并行预处理方法
13.1 不完全分解法
13.1.1 原理
13.1.2 并行化
13.2 舒尔补法
13.2.1 局部最优预处理
13.2.2 舒尔补法的原理
13.2.3 舒尔补法的性质
13.3 代数多重网格
13.3.1 基于投影的预处理
13.3.2 粗糙网格的代数构建
13.3.3 代数多重网格法
13.4 加性施瓦茨预处理法
13.4.1 重叠原理
13.4.2 乘性方法与加性方法
13.4.3 加性Schwarz预处理法
结语
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜