·*贯穿人工智能整个软硬件技术栈 ·以应用驱动,形成智能领域的系统思维 ·以大模型为牵引,为通用人工智能提供支撑
售 价:¥
纸质售价:¥125.50购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
前折页
书名页
编委会名单
丛书序言
序言一
序言二
第2版前言
第1版前言
第1章 概述
1.1 人工智能
1.1.1 什么是人工智能
1.1.2 人工智能的主要方法
1.1.3 人工智能的发展历史
1.2 智能计算系统
1.2.1 什么是智能计算系统
1.2.2 为什么需要智能计算系统
1.2.3 智能计算系统的发展
1.3 驱动范例
1.4 本章小结
习题
第2章 深度学习基础
2.1 机器学习
2.1.1 基本概念
2.1.2 线性回归
2.2 神经网络
2.2.1 感知机
2.2.2 多层感知机
2.2.3 深度学习
2.2.4 神经网络的发展历程
2.3 神经网络的训练方法
2.3.1 正向传播
2.3.2 反向传播
2.4 神经网络的设计基础
2.4.1 网络的拓扑结构
2.4.2 激活函数
2.4.3 损失函数
2.5 过拟合与正则化
2.5.1 过拟合
2.5.2 正则化
2.6 交叉验证
2.7 本章小结
习题
第3章 深度学习应用
3.1 适合图像处理的卷积神经网络
3.1.1 卷积神经网络的总体结构
3.1.2 应用于图像分类的卷积神经网络
3.1.3 应用于图像目标检测的卷积神经网络
3.1.4 应用于图像生成的神经网络
3.2 适合文本/语音处理的循环神经网络
3.2.1 RNN
3.2.2 LSTM
3.2.3 GRU
3.2.4 小结
3.3 大模型
3.3.1 Seq2Seq
3.3.2 注意力机制
3.3.3 Transformer
3.3.4 自然语言处理大模型
3.3.5 图像处理和多模态大模型
3.3.6 基于大模型的智能体系统
3.3.7 小结
3.4 神经网络的优化
3.4.1 初始化方法
3.4.2 梯度下降法
3.4.3 动量法
3.4.4 二阶优化方法
3.4.5 自适应学习率算法
3.5 神经网络量化
3.5.1 数据量化
3.5.2 神经网络量化过程
3.5.3 神经网络量化应用
3.5.4 神经网络的混合精度量化
3.5.5 大模型量化
3.5.6 小结
3.6 驱动范例
3.6.1 图像风格迁移简介
3.6.2 基于卷积神经网络的图像风格迁移算法
3.6.3 实时图像风格迁移算法
3.7 本章小结
习题
第4章 编程框架使用
4.1 编程框架概述
4.1.1 为什么需要编程框架
4.1.2 编程框架的发展历程
4.2 PyTorch概述
4.3 PyTorch编程模型及基本用法
4.3.1 NumPy基础
4.3.2 张量
4.3.3 操作
4.3.4 计算图
4.4 基于PyTorch的模型推理实现
4.4.1 读取输入图像
4.4.2 构建神经网络
4.4.3 实例化神经网络模型
4.4.4 神经网络模型的调试
4.4.5 神经网络模型优化
4.5 基于PyTorch的模型训练实现
4.5.1 加载训练数据集
4.5.2 模型训练
4.5.3 模型的保存与恢复
4.6 驱动范例
4.6.1 加载依赖包
4.6.2 加载并显示内容图像和风格图像
4.6.3 创建输入图像
4.6.4 定义并计算损失函数
4.6.5 构建风格迁移算法
4.6.6 风格迁移算法运行
4.7 本章小结
习题
第5章 编程框架原理
5.1 编程框架设计
5.1.1 设计原则
5.1.2 整体架构
5.2 计算图构建
5.2.1 正向计算图构建
5.2.2 反向计算图构建
5.3 计算图执行
5.3.1 设备管理
5.3.2 张量实现
5.3.3 算子执行
*5.4 深度学习编译
5.4.1 为什么需要深度学习编译
5.4.2 图层级编译优化
5.4.3 算子层级编译优化
5.4.4 常见深度学习编译器
*5.5 分布式训练
5.5.1 为什么需要分布式训练
5.5.2 分布式训练基础
5.5.3 分布式训练方法
5.5.4 分布式训练框架实现
5.6 本章小结
习题
第6章 面向深度学习的处理器原理
6.1 通用处理器
6.1.1 通用处理器的执行原理
6.1.2 通用处理器的结构发展
6.1.3 通用处理器分析和优化
6.1.4 总结和讨论
6.2 向量处理器
6.2.1 向量处理器的执行原理
6.2.2 向量处理器的结构发展
6.2.3 向量处理器分析和优化
6.2.4 总结和讨论
6.3 深度学习处理器
6.3.1 深度学习处理器的执行原理
6.3.2 深度学习处理器的结构发展
6.3.3 总结和讨论
6.4 大规模深度学习处理器
6.4.1 一致性访存模型
6.4.2 非一致性访存模型
6.4.3 分形计算模型
6.4.4 深度学习处理器示例
6.5 本章小结
习题
第7章 深度学习处理器架构
7.1 计算
7.1.1 矩阵运算单元
7.1.2 向量与标量单元
7.1.3 总结和讨论
7.2 存储
7.2.1 便笺存储器
7.2.2 外部存储器访问
7.2.3 总结和讨论
7.3 通信
7.3.1 互联网络
7.3.2 集合通信原语
7.3.3 通信架构设计
7.3.4 总结和讨论
*7.4 设计优化
7.4.1 变换
7.4.2 压缩
7.4.3 近似
7.4.4 非传统结构和器件
7.5 本章小结
习题
第8章 智能编程语言
8.1 为什么需要智能编程语言
8.1.1 语义鸿沟
8.1.2 硬件鸿沟
8.1.3 平台鸿沟
8.1.4 小结
8.2 智能计算系统抽象架构
8.2.1 抽象硬件架构
8.2.2 典型智能计算系统
8.2.3 控制模型
8.2.4 存储模型
8.2.5 计算模型
8.3 智能编程模型
8.3.1 异构编程
8.3.2 多核并行
8.3.3 存储空间
8.4 智能编程语言基础
8.4.1 语法概述
8.4.2 内建变量与内建函数
8.4.3 BCL程序示例
8.5 智能应用编程接口
8.5.1 核函数接口
8.5.2 运行时接口
8.5.3 使用示例
8.6 智能应用功能调试
8.6.1 功能调试方法
8.6.2 功能调试接口
8.6.3 功能调试工具
8.6.4 精度调试方法
8.6.5 功能调试实践
8.7 智能应用性能调优
8.7.1 性能分析工具
8.7.2 性能调优方法
8.8 智能编程语言的应用
8.8.1 高性能算子开发
8.8.2 编程框架算子开发
8.9 本章小结
习题
第9章 大模型计算系统
9.1 大模型算法分析
9.2 大模型驱动范例:BLOOM
9.2.1 BLOOM-176B模型
9.2.2 BLOOM-176B运行平台
9.2.3 BLOOM-176B计算过程及分析
9.3 大模型系统软件
9.3.1 训练场景
9.3.2 推理场景
9.4 大模型基础硬件
9.4.1 大模型计算节点
9.4.2 大模型计算集群
9.5 本章小结
习题
参考文献
后记
推荐阅读
后折页
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜