万本电子书0元读

万本电子书0元读

顶部广告

Python机器学习系统构建(原书第3版)电子书

售       价:¥

13人正在读 | 1人评论 6.2

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
本书涉及近期机器学习领域内的进展,通过对常用数据集的转换和工具库的使用,帮助构建实用的机器学习系统。内容包括如何在原始数据中准确发掘出模式。先从回顾Python机器学习的知识开始,接着了解相关的工具库。可以快速掌握数据集上真实的项目,掌握建模方法,创建推荐系统。全书共14章。第1章介绍机器学习和Python基础知识;第2章使用真实数据进行分类研究;第3章解释如何使用回归算法处理数据;第4章介绍如何使用logistic回归来确定某个问题的用户答案好不好;第5章介绍数据降维技术;第6章介绍聚类,并使用它来查找给定文本的类似新闻报道;第7章介绍如何建立基于客户产品评级的推荐系统;第8章介绍神经网络和深度学习相关的基本原理,以及使用TensorFlow进行CNN和RNN的示例;第9章解释朴素贝叶斯的工作原理,以及如何用它对tweet进行分类;第10章介绍主题建模;第11章和第12章分别讲解如何对音乐和图像进行分类;第13章探索强化学习方法;第14章介绍如何利用云技术来构建更复杂的模型。
目录展开

前言

第1章 Python机器学习入门

1.1 机器学习和Python——梦之队

1.1.1 本书涵盖的和未涵盖的内容

1.1.2 如何最好地阅读本书

1.1.3 遇到困难怎么办

1.1.4 入门指南

1.1.5 机器学习基础

1.1.6 第一个机器学习的小应用

1.2 小结

第2章 使用现实示例进行分类

2.1 鸢尾花数据集

2.1.1 可视化是一个很好的开始

2.1.2 用scikit-learn分类

2.1.3 建立我们的第一个分类模型

2.2 评估——留出数据和交叉验证

2.3 如何测量和比较分类器

2.4 更复杂的数据集和最近邻分类器

2.4.1 了解种子数据集

2.4.2 特征和特征工程

2.4.3 最近邻分类

2.4.4 查看决策边界

2.5 使用哪个分类器

2.6 小结

第3章 回归

3.1 用回归方法预测房价走势

3.2 多维属性回归

3.3 回归中的交叉验证

3.3.1 惩罚化或正则化回归

3.3.2 L1和L2惩罚项

3.4 在scikit-learn中使用Lasso或ElasticNet

3.4.1 Lasso路径的可视化

3.4.2 P-greater-than-N场景

3.4.3 一个基于文本文档的例子

3.4.4 主流的超参设置方法

3.5 用TensorFlow实现回归

3.6 小结

第4章 分类I——检测劣质答案

4.1 本章概览

4.2 学习分类优质答案

4.2.1 数据实例调整

4.2.2 分类器调优

4.3 数据获取

4.3.1 将数据转换为可用的数据块

4.3.2 属性的预选择和处理

4.3.3 定义什么是优质答案

4.4 创建我们的第一个分类器

4.4.1 特征工程

4.4.2 训练分类器

4.4.3 评价分类器的性能

4.4.4 设计更多的特征

4.5 如何改进性能

4.5.1 偏置、方差和它们之间的平衡

4.5.2 修复高偏置

4.5.3 修复高方差

4.5.4 高偏置还是低偏置

4.6 使用logistic回归

4.6.1 用一个小例子了解一些数学原理

4.6.2 将logistic回归用于我们的帖子分类问题

4.7 探索准确率背后的细节——精度和召回

4.8 为分类器减负

4.9 整合分类器

4.10 用TensorFlow分类

4.11 小结

第5章 降维

5.1 本章概览

5.2 选择特征

5.2.1 使用过滤器检测冗余特征

5.2.2 使用包装法从模型中查询特征

5.2.3 其他特征选择方法

5.3 特征投影

5.3.1 主成分分析

5.3.2 PCA的局限性以及LDA如何提供帮助

5.4 多维缩放

5.5 用于降维的自动编码器或神经网络

5.6 小结

第6章 聚类——查找相关帖子

6.1 测量帖子间的相关性

6.1.1 不应该这么做

6.1.2 应该怎么做

6.2 预处理——将测量的相似性作为常用词的相似数量

6.2.1 将原始文本转换成词袋

6.2.2 我们的成就和目标

6.3 聚类

6.3.1 K-means

6.3.2 获取测试数据以评估我们的想法

6.3.3 聚类帖子

6.4 解决最初的挑战

6.5 调整参数

6.6 小结

第7章 推荐系统

7.1 评级预测和推荐

7.2 切分训练集和测试集

7.3 训练数据归一化

7.4 用最近邻方法实现推荐

7.5 用回归方法实现推荐

7.6 结合多种方法

7.7 购物篮分析

7.7.1 获得有用的预测结果

7.7.2 分析超市购物篮

7.8 关联规则挖掘

7.9 小结

第8章 人工神经网络与深度学习

8.1 使用TensorFlow

8.1.1 TensorFlow API

8.1.2 图

8.1.3 会话

8.1.4 有用的操作

8.2 保存和还原神经网络

8.2.1 训练神经网络

8.2.2 卷积神经网络

8.2.3 循环神经网络

8.3 LSTM用于文本预测

8.4 LSTM用于图像处理

8.5 小结

第9章 分类Ⅱ——情感分析

9.1 本章概览

9.2 获取Twitter数据

9.3 介绍朴素贝叶斯分类器

9.3.1 了解贝叶斯定理

9.3.2 简单化

9.3.3 使用朴素贝叶斯进行分类

9.3.4 对未曾出现的和奇怪的单词进行说明

9.3.5 对算术下溢进行说明

9.4 创建并优化第一个分类器

9.4.1 首先解决容易的问题

9.4.2 使用所有类

9.4.3 调整分类器参数

9.5 清理tweet

9.6 考虑单词的类型

9.6.1 确定单词类型

9.6.2 使用SentiWordNet成功作弊

9.6.3 我们的第一个评估器

9.6.4 把所有东西放在一起

9.7 小结

第10章 主题建模

10.1 隐含狄利克雷分配

10.1.1 构建主题模型

10.1.2 按主题比较文档

10.1.3 为整体维基百科建模

10.1.4 选择主题数量

10.2 小结

第11章 分类Ⅲ——音乐流派分类

11.1 本章概览

11.2 获取音乐数据

11.3 观察音乐数据

11.4 使用FFT构建第一个分类器

11.4.1 增加实验灵活性

11.4.2 训练分类器

11.4.3 用混淆矩阵测试多类别问题的准确率

11.4.4 另一种用接收者-操作者特征测量分类性能的方法

11.5 使用梅尔频率倒谱系数改善分类器性能

11.6 用TensorFlow分类音乐

11.7 小结

第12章 计算机视觉

12.1 图像处理简介

12.1.1 加载和显示图像

12.1.2 阈值转换

12.1.3 高斯模糊

12.1.4 聚焦图像中心

12.2 基本图像分类

12.3 从图像中计算特征

12.4 设计自己的特征

12.5 用特征找相似图像

12.6 对更难的数据集分类

12.7 局部特征的表征方法

12.8 用对抗网络生成图像

12.9 小结

第13章 强化学习

13.1 强化学习的类型

13.1.1 策略网络和估值网络

13.1.2 Q-network

13.2 在游戏中表现出色

13.2.1 一个小例子

13.2.2 在文字游戏中使用TensorFlow

13.2.3 玩打砖块游戏

13.3 小结

第14章 大数据

14.1 学习大数据

14.1.1 使用jug将流水线拆分为多个任务

14.1.2 jug中的任务介绍

14.2 探查工作原理

14.3 使用jug进行数据分析

14.4 重用部分结果

14.5 使用Amazon网络服务

14.6 创建第一个虚拟机

14.7 在Amazon Linux上安装Python包

14.8 在云服务机器上运行jug

14.9 使用cfncluster自动生成集群

14.10 小结

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部