如果你正在训练一个机器学习模型,但不确定如何将其投生产,本书将协助你完成目标。Kubeflow为模型生命周期的不同阶段提供了一系列云原生工具,从数据探索和特征准备到模型训练和模型服务。本书可以帮助数据科学家用Kubeflow构建生产级机器学习实现,并向数据工程师展示了如何使模型具有可伸缩性和可靠性。作者使用书中的示例解释了如何使用Kubeflow在云端或者本地发环境中的Kubernetes上训练机器学习模型并为模型提供服务。本书将帮助你: - 理解Kubeflow的设计、核心组件和所能解决的问题。 - 使用Kubeflow和流行的工具(包括Scikit-learn、TensorFlow和Apache Spark)训练模型。 - 使用Kubeflow 流水线使模型保持状态。 - 了解如何获取模型训练的元数据。 - 为超参调优行训练。 - 了解如何在生产中为模型提供服务。 - 探索如何用其他源工具扩展Kubeflow。
售 价:¥
纸质售价:¥69.30购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
关于作者
关于封面
O’Reilly Media,Inc.介绍
译者序
序言
前言
第1章 Kubeflow及其适用对象
1.1 模型开发生命周期
1.2 Kubeflow适合什么场景
1.3 为什么需要容器化
1.4 为什么需要Kubernetes
1.5 Kubeflow的设计和核心组件
1.5.1 使用notebook进行数据探索
1.5.2 数据准备与特征准备
1.5.3 训练
1.5.4 超参调优
1.5.5 模型验证
1.5.6 推理/预测
1.5.7 Pipeline
1.5.8 组件概述
1.6 Kubeflow的替代方案
1.6.1 Clipper
1.6.2 MLflow
1.6.3 其他替代方案
1.7 案例研究
1.7.1 MNIST
1.7.2 邮件列表数据
1.7.3 产品推荐系统
1.7.4 CT扫描
1.8 总结
第2章 你好,Kubeflow
2.1 搭建Kubeflow
2.1.1 安装Kubeflow及其依赖项
2.1.2 搭建本地Kubernetes
2.1.3 搭建Kubeflow开发环境
2.1.4 创建第一个Kubeflow项目
2.2 训练和部署模型
2.2.1 训练和监测进展
2.2.2 测试查询
2.3 超越本地部署
2.4 总结
第3章 Kubeflow设计:超越基础
3.1 中央仪表盘
3.1.1 notebook(JupyterHub)
3.1.2 训练operator
3.1.3 初识Kubeflow Pipeline
3.1.4 超参调优
3.1.5 模型推理
3.1.6 元数据
3.1.7 组件概述
3.2 支持组件
3.2.1 MinIO
3.2.2 Istio
3.2.3 Knative
3.2.4 Apache Spark
3.2.5 Kubeflow多用户隔离
3.3 总结
第4章 Kubeflow Pipeline
4.1 Pipeline入门
4.1.1 探索预置的Pipeline样例
4.1.2 用Python构建一个简单的Pipeline
4.1.3 步骤之间存储数据
4.2 Kubeflow Pipeline组件介绍
4.2.1 Argo:Pipeline的基石
4.2.2 Kubeflow Pipeline对Argo工作流的增强
4.2.3 使用现有镜像构建Pipeline
4.2.4 Kubeflow Pipeline组件
4.3 Pipeline高级主题
4.3.1 Pipeline阶段的条件执行
4.3.2 按计划执行Pipeline
4.4 总结
第5章 数据准备和特征准备
5.1 选择正确的工具
5.2 本地数据准备和特征准备
5.2.1 获取数据
5.2.2 数据清理:过滤垃圾信息
5.2.3 格式化数据
5.2.4 特征准备
5.2.5 自定义容器
5.3 分布式工具
5.3.1 TensorFlow扩展
5.3.2 使用Apache Spark的分布式数据
5.3.3 使用Apache Spark的分布式特征准备
5.4 将其整合到一个Pipeline中
5.5 将整个notebook作为数据准备Pipeline阶段使用
5.6 总结
第6章 制品和元数据存储
6.1 Kubeflow ML Metadata
6.1.1 编程查询
6.1.2 Kubeflow Metadata用户界面
6.2 基于Kubeflow的MLflow元数据工具
6.2.1 创建和部署MLflow跟踪服务器
6.2.2 记录运行数据
6.2.3 使用MLflow用户界面
6.3 总结
第7章 训练机器学习模型
7.1 用TensorFlow构建推荐器
7.1.1 入门
7.1.2 创建一个新notebook会话
7.1.3 TensorFlow训练
7.2 部署TensorFlow训练作业
7.3 分布式训练
7.3.1 使用GPU
7.3.2 使用其他框架进行分布式训练
7.4 使用scikit-learn训练模型
7.4.1 建立新的notebook会话
7.4.2 数据准备
7.4.3 Scikit-learn训练
7.4.4 解释模型
7.4.5 导出模型
7.4.6 集成到Pipeline
7.5 总结
第8章 模型推断
8.1 模型服务
8.2 模型监控
8.2.1 模型的准确性、漂移和可解释性
8.2.2 模型监控要求
8.3 模型更新
8.4 推理要求概述
8.5 Kubeflow中的模型推理
8.6 TensorFlow Serving
8.7 Seldon Core
8.7.1 设计Seldon推理图
8.7.2 测试模型
8.7.3 服务请求
8.7.4 监控模型
8.7.5 审阅
8.8 KFServing
8.8.1 Serverless和服务平面
8.8.2 数据平面
8.8.3 示例演练
8.8.4 剥离底层基础设施
8.8.5 审阅
8.9 总结
第9章 多工具使用案例
9.1 CT扫描去噪示例
9.1.1 使用Python进行数据准备
9.1.2 使用Apache Spark进行DS-SVD
9.1.3 可视化
9.1.4 CT扫描去噪Pipeline
9.2 共享Pipeline
9.3 总结
第10章 超参调优和自动化机器学习
10.1 AutoML概述
10.2 使用Kubeflow Katib进行超参调优
10.3 Katib概念
10.4 安装Katib
10.5 运行第一个Katib实验
10.5.1 准备训练代码
10.5.2 配置实验
10.5.3 运行实验
10.5.4 Katib用户界面
10.6 调优分布式训练作业
10.7 神经网络架构搜索
10.8 Katib的优势
10.9 总结
附录A Argo执行器配置和权衡
附录B 特定于云的工具和配置
附录C 在应用程序中使用模型服务
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜